เครื่องกำเนิดภาพ AI นี้ให้คุณพิมพ์คำและรับรูปภาพแปลก ๆ กลับมา

กรกฎาคม 14, 2022

ในช่วงไม่กี่สัปดาห์ที่ผ่านมา เด็กฝึกงานด้านการตลาดดิจิทัล หรือที่รู้จักกันดีทางออนไลน์ในชื่อ @weirddalle ค่ะได้แชร์รูปภาพที่พรรณนาถึงสิ่งต่างๆเช่นคน ดูดฝุ่น ในป่า Demogorgon จาก “Stranger Things” ของ Netflix ถือ บาสเก็ตบอล และ Beanie Baby ที่ หน้าเหมือนมาก แดนนี่ เดวิโต้.

รูปภาพเหล่านี้และรูปภาพอื่นๆ ซึ่งมีตั้งแต่เรื่องไร้สาระไปจนถึงน่าวิตก ถูกสร้างขึ้นด้วยระบบปัญญาประดิษฐ์ที่เรียกว่า Craiyon ซึ่งใช้ได้ฟรี ในการใช้งาน คุณเพียงแค่พิมพ์สิ่งที่คุณต้องการจินตนาการ เช่น “สิงโตสีรุ้งกินพิซซ่าชิ้นหนึ่ง” แล้วมันก็จะคายรูปภาพออกมาเป็นคำตอบ

“ฉันคิดว่านั่นคือประเด็นหลัก: คุณสามารถทำให้ทุกอย่างเป็นจริงได้” Laming กล่าวในการให้สัมภาษณ์กับ CNN Business

ผลิตผลงานของ Boris Dayma วิศวกรด้านแมชชีนเลิร์นนิงในออสติน Craiyon กำลังเผยแพร่แนวโน้มที่เพิ่มขึ้นใน AI คอมพิวเตอร์เริ่มดีขึ้นเรื่อย ๆ ในการกลืนกินคำและสร้างภาพที่ดูสมจริงมากขึ้นในการตอบสนอง เมื่อเร็ว ๆ นี้ผู้คนกำลังพิมพ์ข้อความแจ้งประมาณ 5 ล้านครั้งต่อวัน Dayma กล่าว

มีระบบ AI ที่คล้ายกันและมีประสิทธิภาพมากกว่า Craiyon เช่น DALL-E ของ OpenAI (เดิมชื่อ Craiyon DALL-E Mini เป็นการแสดงความเคารพ) และ DALL-E 2 รวมถึง Imagen ของ Google แต่ต่างจาก Craiyon ที่ใครๆ ก็ลองได้ ส่วนใหญ่ไม่เปิดให้สาธารณชนเข้าชม: DALL-E 2 เปิดให้ผู้ใช้ผ่านคำเชิญเท่านั้น ในขณะที่ Imagen ไม่ได้เปิดให้ผู้ใช้ภายนอก Google

รูปภาพที่สร้างโดย Craiyon ซึ่งเป็นระบบ AI ที่ทุกคนสามารถใช้เพื่อป้อนข้อความไปยังคอมพิวเตอร์และรับรูปภาพตอบกลับ

“ฉันคิดว่าสิ่งสำคัญคือต้องมีทางเลือกอื่นที่ทุกคนสามารถเข้าถึงเทคโนโลยีประเภทนี้ได้เหมือนกัน” Dayma กล่าว

อย่างไรก็ตาม ในกระบวนการนี้ Craiyon ทำหน้าที่เป็นการทดลองใช้อย่างมีประสิทธิภาพสำหรับสิ่งที่อาจเกิดขึ้น ไม่ว่าจะดีหรือไม่ดี ในอนาคตหากใครก็ตามสามารถเข้าถึงระบบ AI ดังกล่าวและขอภาพประเภทใดก็ได้จากพวกเขาด้วยคำพูดเพียงไม่กี่คำ และเช่นเดียวกับเทคโนโลยีที่พึ่งเกิดขึ้นมากมาย มันคืองานที่กำลังดำเนินอยู่ ในระยะอันใกล้นี้ หากปล่อยไว้โดยไม่เลือก ก็อาจสร้างผลลัพธ์ที่ตอกย้ำทัศนคติแบบเหมารวมและอคติ

BFG ฉาวโฉ่

Dayma และโปรแกรมเมอร์คนอื่นๆ สร้างระบบ AI เมื่อเดือนกรกฎาคมปีที่แล้ว ระหว่างงาน Hackathon ซึ่งจัดโดย Google และ Hugging Face บริษัทที่สร้างและโฮสต์โมเดล AI ในขั้นต้น Dayma กล่าวว่าเขาสร้างมันเป็นความท้าทายทางเทคนิค เขาคิดว่า DALL-E เท่และเขาต้องการสร้างมันขึ้นมาเอง เขาโพสต์โปรแกรมสร้างข้อความเป็นรูปภาพ – จากนั้นเรียกว่า DALL-E Mini – บน Hugging Face ซึ่งทุกคนสามารถทดลองใช้ได้ (ยังคงมีอยู่ในชื่อนั้น) แต่กลับไม่ได้รับความสนใจมากนักจากชุมชน AI จนกระทั่งช่วงสองสามเดือนที่ผ่านมา อาจเป็นเพราะคุณภาพของภาพที่จำกัด

ตัวอย่างเช่น ในอดีต มันสามารถจินตนาการถึงสิ่งธรรมดาๆ เช่น ภูมิทัศน์ได้ Dayma กล่าว แต่ทีละเล็กทีละน้อย เขาได้ทำสิ่งต่างๆ เช่น แก้ไขข้อบกพร่องและปรับปรุงโค้ด ซึ่งช่วยให้สร้างภาพที่ซับซ้อนมากขึ้นได้ดีขึ้น เช่น หอไอเฟลที่ลงจอดบนดวงจันทร์

“เมื่อนางแบบเริ่มวาดภาพนั้น ฉันมีความสุขมาก” เขากล่าว “แต่แล้วผู้คนก็สร้างสรรค์สิ่งต่าง ๆ มากขึ้น และด้วยเหตุใดโมเดลก็มาถึงช่วงเวลาที่สามารถทำบางสิ่งที่ดูเหมือนสิ่งที่พวกเขาขอ และฉันคิดว่านั่นเป็นจุดเปลี่ยน”

ภาพที่ Craiyon สร้างขึ้นนั้นไม่ได้ดูสมจริงเหมือนที่ DALL-E 2 หรือ Imagen คิดขึ้นมาได้ แต่ก็มีความน่าสนใจอยู่ดี: ผู้คนมักจะเบลอวัตถุ และภาพดูคลุมเครือและอย่างน้อยก็เบี้ยวเล็กน้อย

สำหรับตอนนี้ Craiyon ส่วนใหญ่ถูกใช้เพื่อความสนุกสนานโดยผู้คนอย่าง Laming — ส่วนหนึ่งอาจเป็นเพราะผลลัพธ์ที่ได้ไม่คมชัดหรือเหมือนภาพถ่ายเหมือนภาพที่คุณจะได้รับจาก DALL-E 2 หรือ Imagen แต่ยังเป็นเพราะผู้คนยังคงพยายาม คิดออกว่าจะทำอย่างไรกับมัน (ปัจจุบันเว็บไซต์ Craiyon ใช้งานโฆษณาเพื่อชดใช้ค่าใช้จ่ายสำหรับเซิร์ฟเวอร์ที่ขับเคลื่อนระบบ AI และ Dayma กล่าวว่าเขาพยายามหาวิธีสร้างรายได้จากมันในขณะที่ยังอนุญาตให้ผู้คนเล่นได้ฟรี)

รูปภาพจำนวนมากที่ Laming โพสต์บน Twitter มาจากฟอรัม Reddit ที่เขาสร้างขึ้นเพื่อให้ผู้คนสามารถโพสต์ข้อความแจ้งและผลลัพธ์ที่ได้เมื่อพวกเขาเรียกใช้ผ่านระบบ นี่เป็นวิธีเดียวกับที่เขาใช้กับบัญชี Twitter อื่นที่เขาใช้ @spotifyweirdซึ่งทวีตเพลย์ลิสต์ Spotify ที่แปลกประหลาด

ทวีตที่ได้รับความนิยมมากที่สุดของ Laming คือโพสต์เมื่อวันที่ 14 มิถุนายนโดยมีข้อความว่า “Fisher Price guillotine” ซึ่งในตอนแรกผู้ใช้ Reddit โพสต์ลงใน subreddit ของเขา โพสต์ยอดนิยมอาจนำรายการจากข่าวหรือวัฒนธรรมป๊อปมาผสมกับสิ่งที่สุ่มหรือน่าตกใจหรือน่าขยะแขยงอย่างสมบูรณ์ เช่น โถฉี่ธีมมินเนี่ยน หรือเพียงแค่คิดเล่นคำ (ลองคิดดู) “บีเอฟจีฉาวโฉ่” หรือ “ก้อนน้ำแข็งในก้อนน้ำแข็ง”).

เมื่อผู้ใช้คุ้นเคยกับประเภทของผลลัพธ์ที่ Craiyon สามารถสร้างได้ ข้อความแจ้งจะมีความเฉพาะเจาะจงมากขึ้นในแง่ของประเภทของภาพที่พวกเขาต้องการเห็น เช่น การเรียกร้องให้ ภาพประกอบทางการแพทย์ของ burrito หรือภาพร่างห้องพิจารณาคดีที่แสดง หน้าตาจะเป็นอย่างไร ถ้า capybara ฟ้อง Elon Musk บางครั้งมันก็แปลกจริงๆ อย่างเช่นในภาพนี้ของ นักโบราณคดีค้นพบเก้าอี้พลาสติก.

เพื่อให้ได้พรอมต์ที่ดี Laming แนะนำว่า “ลองนึกถึงสถานการณ์ที่แปลกประหลาดที่สุดที่จะนำใครบางคนหรือบางสิ่งบางอย่างเข้ามา” ผลที่ตามมาก็คือ ข้อความแจ้งที่นำไปสู่ภาพเหล่านี้อาจเป็นรูปแบบใหม่ของความคิดสร้างสรรค์

อคติบนจอแสดงผล

Mar Hicks รองศาสตราจารย์แห่งสถาบันเทคโนโลยีอิลลินอยส์ซึ่งศึกษาประวัติศาสตร์ของเทคโนโลยีกล่าวว่าระบบ AI นี้ทำให้พวกเขานึกถึงแชทบ็อตในยุคแรกๆ เช่น Eliza ซึ่งเป็นโปรแกรมคอมพิวเตอร์ที่สร้างโดยศาสตราจารย์ Joseph Weizenbaum ของ MIT ในปี 1960 และตั้งใจจะเลียนแบบนักบำบัด . โปรแกรมดังกล่าวสามารถโน้มน้าวใจผู้คนที่พวกเขากำลังสื่อสารกับมนุษย์อีกคนหนึ่ง แม้ว่าคอมพิวเตอร์จะไม่เข้าใจสิ่งที่มันบอกอย่างแท้จริง (Eliza ให้คำตอบเป็นสคริปต์)

“ ฉันคิดว่ามันน่าดึงดูดเช่นเดียวกับเกมแห่งโอกาสที่น่าดึงดูดหรือเกมปาร์ตี้” ฮิกส์กล่าว “มีระดับของความไม่แน่นอนเกี่ยวกับสิ่งที่จะเกิดขึ้น”

แต่ฮิกส์กังวลเกี่ยวกับความสามารถของระบบ AI ในการตอบสนองต่อข้อความแจ้งที่เป็นลายลักษณ์อักษรพร้อมรูปภาพ แทนที่จะให้ข้อความแสดงข้อผิดพลาดเป็นครั้งคราวเพื่อระบุว่าไม่ทราบวิธีแยกวิเคราะห์วลีที่บุคคลที่พิมพ์ “นั่นหมายความว่าคุณจะได้รับขยะในบางครั้ง” พวกเขากล่าว และหน้าที่เป็นความรับผิดชอบของผู้ใช้ที่จะหาสาเหตุ นี่เป็นกรณีที่มีคำแนะนำบางอย่างที่ฉันป้อนให้กับ Craiyon ทำให้บางครั้งน่าผิดหวังและน่าผิดหวังที่จะใช้ แต่ Dayma ชี้ให้เห็นว่ามันไม่ง่ายเลยที่จะคาดเดาสิ่งที่วาดได้หรือวาดไม่ได้ และบางครั้งผลลัพธ์ก็น่าประหลาดใจหรืออย่างน้อย แปลกอย่างน่าประหลาด.

Dayma กล่าวว่าเขาได้ยินจากคนที่ใช้ Craiyon ในการสร้างโลโก้สำหรับธุรกิจใหม่และเป็นภาพในวิดีโอ (OpenAI และ Google ได้แนะนำว่าในที่สุดระบบของพวกเขาอาจถูกใช้สำหรับสิ่งต่าง ๆ เช่นการแก้ไขภาพและสร้างภาพสต็อก)

ภาพที่แสดงให้เห็นว่าระบบ AI ของ Craiyon ซึ่งเดิมเรียกว่า DALL-E Mini นั้นสร้างภาพได้ดีขึ้นเมื่อเวลาผ่านไปอย่างไรสำหรับข้อความแจ้ง "หอไอเฟลกำลังลงจอดบนดวงจันทร์"

แม้ว่าระบบ AI เหล่านี้อาจมีความเป็นไปได้ที่สร้างสรรค์ แต่ก็มีปัญหาสำคัญที่แพร่หลายไปทั่วอุตสาหกรรม AI: ความลำเอียง พวกเขาทั้งหมดได้รับการฝึกอบรมเกี่ยวกับข้อมูลที่มีแนวกว้างของอินเทอร์เน็ต ซึ่งหมายความว่ารูปภาพที่พวกเขาสร้างขึ้นสามารถแสดงอคติได้หลายอย่าง เช่น เพศ เชื้อชาติ และแบบแผนทางสังคม

อคติดังกล่าวปรากฏชัดแม้ในภาพที่ดูคลุมเครือของ Craiyon และเนื่องจากทุกคนสามารถพิมพ์อะไรก็ได้ที่พวกเขาต้องการ มันอาจเป็นหน้าต่างที่รบกวนว่าการเหมารวมสามารถซึมเข้าไปใน AI ได้อย่างไร เมื่อเร็ว ๆ นี้ฉันได้ให้ “ทนายความ” แก่ Craiyon และผลลัพธ์ทั้งหมดเป็นภาพที่ไม่ชัดเจนของสิ่งที่ดูเหมือนจะเป็นผู้ชายในชุดคลุมของผู้พิพากษาผิวดำ ในขณะเดียวกัน “ครู” ก็ให้ผลเฉพาะตัวเลขที่ดูเหมือนจะเป็นผู้หญิง แต่ละคนสวมเสื้อเชิ้ตแบบมีกระดุม

เดย์มะรู้เรื่องนี้ดี ส่วน “คำถามที่พบบ่อย” ในเว็บไซต์ของ Craiyon ระบุว่าโมเดลที่พึ่งพาข้อมูลอินเทอร์เน็ตอาจส่งผลให้เกิด “ภาพที่มีลักษณะเหมารวมที่เป็นอันตราย” และผู้ที่อยู่เบื้องหลัง Craiyon กำลังทำงานเพื่อบันทึกและวิเคราะห์อคติ Dayma ตั้งข้อสังเกตว่าระบบ AI จำนวนมากมีอคติ ไม่ว่าผู้ใช้จะรับรู้หรือไม่ก็ตาม และกล่าวว่าเขาชอบที่ทุกคนสามารถสังเกตอคติของ Craiyon ได้โดยตรงจากภาพที่มันสร้างขึ้น

เขายังบอกด้วยว่าเขาพยายามป้องกันไม่ให้โมเดลที่อยู่เบื้องหลัง Craiyon เรียนรู้แนวคิดบางอย่างเพื่อเริ่มต้น อย่างไรก็ตาม ฉันใช้เวลาเพียงไม่กี่นาทีในการแสดงข้อความแจ้งที่ชัดเจนซึ่งให้ภาพที่พูดตรงๆ ว่าไม่ปลอดภัยสำหรับการทำงาน

เมื่อถูกถามว่าเขาคิดว่าการมีอยู่ทั่วไปของภาพดังกล่าวอาจเป็นสิ่งที่ไม่ดีหรือไม่ เนื่องจากมีอคติที่ชัดเจน เขาชี้ให้เห็นว่าภาพที่ปรากฏขึ้นในขณะที่ดูดีกว่าในอดีตนั้นไม่สมจริงอย่างชัดเจน

“ถ้าฉันวาดหอไอเฟลบนดวงจันทร์ ฉันหวังว่าไม่มีใครเชื่อว่าหอไอเฟลอยู่บนดวงจันทร์จริงๆ” เขากล่าว

คำแนะนำการอ่านบทความนี้ : บางบทความในเว็บไซต์ ใช้ระบบแปลภาษาอัตโนมัติ คำศัพท์เฉพาะบางคำอาจจะทำให้ไม่เข้าใจ สามารถเปลี่ยนภาษาเว็บไซต์เป็นภาษาอังกฤษ หรือปรับเปลี่ยนภาษาในการใช้งานเว็บไซต์ได้ตามที่ถนัด บทความของเรารองรับการใช้งานได้หลากหลายภาษา หากใช้ระบบแปลภาษาที่เว็บไซต์ยังไม่เข้าใจ สามารถศึกษาเพิ่มเติมโดยคลิกลิ้งค์ที่มาของบทความนี้ตามลิ้งค์ที่อยู่ด้านล่างนี้

ที่มาบทความนี้

บทความก่อนหน้านี้

ไบเดนหยุดพูดสั้น ๆ ว่าเขาจะยกคดีฆาตกรรม Khashoggi ในซาอุดิอาระเบีย

บทความถัดไป

หุ้นก่อนออกตลาด: การปรับขึ้นอัตราดอกเบี้ยครั้งใหญ่อย่างแท้จริงอยู่บนโต๊ะ

Cookie	Duration	Description
cookielawinfo-checkbox-analytics	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Analytics".
cookielawinfo-checkbox-functional	11 months	The cookie is set by GDPR cookie consent to record the user consent for the cookies in the category "Functional".
cookielawinfo-checkbox-necessary	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookies is used to store the user consent for the cookies in the category "Necessary".
cookielawinfo-checkbox-others	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Other.
cookielawinfo-checkbox-performance	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Performance".
viewed_cookie_policy	11 months	The cookie is set by the GDPR Cookie Consent plugin and is used to store whether or not user has consented to the use of cookies. It does not store any personal data.

ไตรมาสแรกกำลังดำเนินการสำหรับการเติบโตของ GDP เชิงลบ Atlanta Fed Indicator กล่าวว่า

ภัยคุกคามภาษีของทรัมป์: USD/CAD กระทบสูงสามสัปดาห์

Elliott Wave View: FTSE ควรเห็นข้อเสียมากขึ้น

การตัดงานของรัฐบาลกลางขัดขวางภาพการเกษียณอายุที่มั่นคงสำหรับคนงานหลายคนรวมถึงชาวอเมริกันผิวดำ

ดอลลาร์พุ่งสูงขึ้นเนื่องจากทรัมป์ยืนยันแผนภาษียูโรดูอ่อนแอ

อัตราประกายไฟ: ตลาดแสวงหาสัญญาณระหว่างเสียงรบกวน

ก๊าซธรรมชาติต้องเผชิญกับความเสี่ยงในการพังทลายด้วยการสนับสนุนที่สำคัญที่ $ 3.9117 ภายใต้แรงกดดัน

State Street, Apollo ร่วมมือกันเพื่อเปิดตัว ETF เครดิตส่วนตัวที่ใจดีก่อน

หุ้นที่ทำให้การเคลื่อนไหวครั้งใหญ่ที่สุดหลังจากเวลาผ่านไป: Dell, Autodesk, Duolingo, NetApp และอีกมากมาย

วุฒิสมาชิกย่างผู้อำนวยการ CFPB ของทรัมป์เลือก: คุณอยู่บนไททานิคโชคดี '

วิเคราะห์คู่เงิน EURUSD ประจำวันที่ 27 กุมภาพันธ์ 2568

วิเคราะห์คู่เงิน GBPUSD ประจำวันที่ 27 กุมภาพันธ์ 2568

วิเคราะห์คู่เงิน USDJPY ประจำวันที่ 27 กุมภาพันธ์ 2568

วิเคราะห์คู่เงิน USDCAD ประจำวันที่ 27 กุมภาพันธ์ 2568

วิเคราะห์คู่เงิน USDCHF ประจำวันที่ 27 กุมภาพันธ์ 2568

วิเคราะห์ ทองคำ ประจำวันที่ 27 กุมภาพันธ์ 2568

วิเคราะห์ ทองคำ ประจำวันที่ 25 กุมภาพันธ์ 2568

วิเคราะห์ ทองคำ ประจำวันที่ 17 กุมภาพันธ์ 2568

วิเคราะห์ ทองคำ ประจำวันที่ 13 กุมภาพันธ์ 2568

วิเคราะห์ ทองคำ ประจำวันที่ 10 กุมภาพันธ์ 2568

Ethereum Retraces สู่ระดับความต้องการรายเดือนที่สำคัญ – ETH สามารถขายแรงกดดันได้หรือไม่?

วันหมดอายุของ Bitcoin Boom? CEO Cryptoquant เปิดเผยไทม์ไลน์

TVL ลดลง Memecoin Mania สวมและราคาที่เสี่ยงต่อการลดลงต่ำกว่า $ 110 – Cryptoninjas

Litecoin มีโครงสร้างที่มั่นคงท่ามกลางการสลายตลาด – นักวิเคราะห์คาดการณ์ว่าจะมีการเคลื่อนไหวครั้งใหญ่

ยอดขายล่วงหน้าที่ดีที่สุดในการซื้อเป็น bitcoin ขายออกทำให้ผู้ค้าขายที่ขาดทุน