spot_imgspot_img
spot_img
หน้าแรกNEWSTODAYเครื่องกำเนิดภาพ AI นี้ให้คุณพิมพ์คำและรับรูปภาพแปลก ๆ กลับมา

เครื่องกำเนิดภาพ AI นี้ให้คุณพิมพ์คำและรับรูปภาพแปลก ๆ กลับมา


ในช่วงไม่กี่สัปดาห์ที่ผ่านมา เด็กฝึกงานด้านการตลาดดิจิทัล หรือที่รู้จักกันดีทางออนไลน์ในชื่อ @weirddalle ค่ะได้แชร์รูปภาพที่พรรณนาถึงสิ่งต่างๆเช่นคน ดูดฝุ่น ในป่า Demogorgon จาก “Stranger Things” ของ Netflix ถือ บาสเก็ตบอล และ Beanie Baby ที่ หน้าเหมือนมาก แดนนี่ เดวิโต้.
รูปภาพเหล่านี้และรูปภาพอื่นๆ ซึ่งมีตั้งแต่เรื่องไร้สาระไปจนถึงน่าวิตก ถูกสร้างขึ้นด้วยระบบปัญญาประดิษฐ์ที่เรียกว่า Craiyon ซึ่งใช้ได้ฟรี ในการใช้งาน คุณเพียงแค่พิมพ์สิ่งที่คุณต้องการจินตนาการ เช่น “สิงโตสีรุ้งกินพิซซ่าชิ้นหนึ่ง” แล้วมันก็จะคายรูปภาพออกมาเป็นคำตอบ

“ฉันคิดว่านั่นคือประเด็นหลัก: คุณสามารถทำให้ทุกอย่างเป็นจริงได้” Laming กล่าวในการให้สัมภาษณ์กับ CNN Business

ผลิตผลงานของ Boris Dayma วิศวกรด้านแมชชีนเลิร์นนิงในออสติน Craiyon กำลังเผยแพร่แนวโน้มที่เพิ่มขึ้นใน AI คอมพิวเตอร์เริ่มดีขึ้นเรื่อย ๆ ในการกลืนกินคำและสร้างภาพที่ดูสมจริงมากขึ้นในการตอบสนอง เมื่อเร็ว ๆ นี้ผู้คนกำลังพิมพ์ข้อความแจ้งประมาณ 5 ล้านครั้งต่อวัน Dayma กล่าว

มีระบบ AI ที่คล้ายกันและมีประสิทธิภาพมากกว่า Craiyon เช่น DALL-E ของ OpenAI (เดิมชื่อ Craiyon DALL-E Mini เป็นการแสดงความเคารพ) และ DALL-E 2 รวมถึง Imagen ของ Google แต่ต่างจาก Craiyon ที่ใครๆ ก็ลองได้ ส่วนใหญ่ไม่เปิดให้สาธารณชนเข้าชม: DALL-E 2 เปิดให้ผู้ใช้ผ่านคำเชิญเท่านั้น ในขณะที่ Imagen ไม่ได้เปิดให้ผู้ใช้ภายนอก Google

รูปภาพที่สร้างโดย Craiyon ซึ่งเป็นระบบ AI ที่ทุกคนสามารถใช้เพื่อป้อนข้อความไปยังคอมพิวเตอร์และรับรูปภาพตอบกลับ

“ฉันคิดว่าสิ่งสำคัญคือต้องมีทางเลือกอื่นที่ทุกคนสามารถเข้าถึงเทคโนโลยีประเภทนี้ได้เหมือนกัน” Dayma กล่าว

อย่างไรก็ตาม ในกระบวนการนี้ Craiyon ทำหน้าที่เป็นการทดลองใช้อย่างมีประสิทธิภาพสำหรับสิ่งที่อาจเกิดขึ้น ไม่ว่าจะดีหรือไม่ดี ในอนาคตหากใครก็ตามสามารถเข้าถึงระบบ AI ดังกล่าวและขอภาพประเภทใดก็ได้จากพวกเขาด้วยคำพูดเพียงไม่กี่คำ และเช่นเดียวกับเทคโนโลยีที่พึ่งเกิดขึ้นมากมาย มันคืองานที่กำลังดำเนินอยู่ ในระยะอันใกล้นี้ หากปล่อยไว้โดยไม่เลือก ก็อาจสร้างผลลัพธ์ที่ตอกย้ำทัศนคติแบบเหมารวมและอคติ

BFG ฉาวโฉ่

Dayma และโปรแกรมเมอร์คนอื่นๆ สร้างระบบ AI เมื่อเดือนกรกฎาคมปีที่แล้ว ระหว่างงาน Hackathon ซึ่งจัดโดย Google และ Hugging Face บริษัทที่สร้างและโฮสต์โมเดล AI ในขั้นต้น Dayma กล่าวว่าเขาสร้างมันเป็นความท้าทายทางเทคนิค เขาคิดว่า DALL-E เท่และเขาต้องการสร้างมันขึ้นมาเอง เขาโพสต์โปรแกรมสร้างข้อความเป็นรูปภาพ – จากนั้นเรียกว่า DALL-E Mini – บน Hugging Face ซึ่งทุกคนสามารถทดลองใช้ได้ (ยังคงมีอยู่ในชื่อนั้น) แต่กลับไม่ได้รับความสนใจมากนักจากชุมชน AI จนกระทั่งช่วงสองสามเดือนที่ผ่านมา อาจเป็นเพราะคุณภาพของภาพที่จำกัด

ตัวอย่างเช่น ในอดีต มันสามารถจินตนาการถึงสิ่งธรรมดาๆ เช่น ภูมิทัศน์ได้ Dayma กล่าว แต่ทีละเล็กทีละน้อย เขาได้ทำสิ่งต่างๆ เช่น แก้ไขข้อบกพร่องและปรับปรุงโค้ด ซึ่งช่วยให้สร้างภาพที่ซับซ้อนมากขึ้นได้ดีขึ้น เช่น หอไอเฟลที่ลงจอดบนดวงจันทร์

“เมื่อนางแบบเริ่มวาดภาพนั้น ฉันมีความสุขมาก” เขากล่าว “แต่แล้วผู้คนก็สร้างสรรค์สิ่งต่าง ๆ มากขึ้น และด้วยเหตุใดโมเดลก็มาถึงช่วงเวลาที่สามารถทำบางสิ่งที่ดูเหมือนสิ่งที่พวกเขาขอ และฉันคิดว่านั่นเป็นจุดเปลี่ยน”

ภาพที่ Craiyon สร้างขึ้นนั้นไม่ได้ดูสมจริงเหมือนที่ DALL-E 2 หรือ Imagen คิดขึ้นมาได้ แต่ก็มีความน่าสนใจอยู่ดี: ผู้คนมักจะเบลอวัตถุ และภาพดูคลุมเครือและอย่างน้อยก็เบี้ยวเล็กน้อย

สำหรับตอนนี้ Craiyon ส่วนใหญ่ถูกใช้เพื่อความสนุกสนานโดยผู้คนอย่าง Laming — ส่วนหนึ่งอาจเป็นเพราะผลลัพธ์ที่ได้ไม่คมชัดหรือเหมือนภาพถ่ายเหมือนภาพที่คุณจะได้รับจาก DALL-E 2 หรือ Imagen แต่ยังเป็นเพราะผู้คนยังคงพยายาม คิดออกว่าจะทำอย่างไรกับมัน (ปัจจุบันเว็บไซต์ Craiyon ใช้งานโฆษณาเพื่อชดใช้ค่าใช้จ่ายสำหรับเซิร์ฟเวอร์ที่ขับเคลื่อนระบบ AI และ Dayma กล่าวว่าเขาพยายามหาวิธีสร้างรายได้จากมันในขณะที่ยังอนุญาตให้ผู้คนเล่นได้ฟรี)

รูปภาพที่สร้างโดย Craiyon ซึ่งเป็นระบบ AI ที่ทุกคนสามารถใช้เพื่อป้อนข้อความไปยังคอมพิวเตอร์และรับรูปภาพตอบกลับ
รูปภาพจำนวนมากที่ Laming โพสต์บน Twitter มาจากฟอรัม Reddit ที่เขาสร้างขึ้นเพื่อให้ผู้คนสามารถโพสต์ข้อความแจ้งและผลลัพธ์ที่ได้เมื่อพวกเขาเรียกใช้ผ่านระบบ นี่เป็นวิธีเดียวกับที่เขาใช้กับบัญชี Twitter อื่นที่เขาใช้ @spotifyweirdซึ่งทวีตเพลย์ลิสต์ Spotify ที่แปลกประหลาด
ทวีตที่ได้รับความนิยมมากที่สุดของ Laming คือโพสต์เมื่อวันที่ 14 มิถุนายนโดยมีข้อความว่า “Fisher Price guillotine” ซึ่งในตอนแรกผู้ใช้ Reddit โพสต์ลงใน subreddit ของเขา โพสต์ยอดนิยมอาจนำรายการจากข่าวหรือวัฒนธรรมป๊อปมาผสมกับสิ่งที่สุ่มหรือน่าตกใจหรือน่าขยะแขยงอย่างสมบูรณ์ เช่น โถฉี่ธีมมินเนี่ยน หรือเพียงแค่คิดเล่นคำ (ลองคิดดู) “บีเอฟจีฉาวโฉ่” หรือ “ก้อนน้ำแข็งในก้อนน้ำแข็ง”).
เมื่อผู้ใช้คุ้นเคยกับประเภทของผลลัพธ์ที่ Craiyon สามารถสร้างได้ ข้อความแจ้งจะมีความเฉพาะเจาะจงมากขึ้นในแง่ของประเภทของภาพที่พวกเขาต้องการเห็น เช่น การเรียกร้องให้ ภาพประกอบทางการแพทย์ของ burrito หรือภาพร่างห้องพิจารณาคดีที่แสดง หน้าตาจะเป็นอย่างไร ถ้า capybara ฟ้อง Elon Musk บางครั้งมันก็แปลกจริงๆ อย่างเช่นในภาพนี้ของ นักโบราณคดีค้นพบเก้าอี้พลาสติก.

เพื่อให้ได้พรอมต์ที่ดี Laming แนะนำว่า “ลองนึกถึงสถานการณ์ที่แปลกประหลาดที่สุดที่จะนำใครบางคนหรือบางสิ่งบางอย่างเข้ามา” ผลที่ตามมาก็คือ ข้อความแจ้งที่นำไปสู่ภาพเหล่านี้อาจเป็นรูปแบบใหม่ของความคิดสร้างสรรค์

อคติบนจอแสดงผล

Mar Hicks รองศาสตราจารย์แห่งสถาบันเทคโนโลยีอิลลินอยส์ซึ่งศึกษาประวัติศาสตร์ของเทคโนโลยีกล่าวว่าระบบ AI นี้ทำให้พวกเขานึกถึงแชทบ็อตในยุคแรกๆ เช่น Eliza ซึ่งเป็นโปรแกรมคอมพิวเตอร์ที่สร้างโดยศาสตราจารย์ Joseph Weizenbaum ของ MIT ในปี 1960 และตั้งใจจะเลียนแบบนักบำบัด . โปรแกรมดังกล่าวสามารถโน้มน้าวใจผู้คนที่พวกเขากำลังสื่อสารกับมนุษย์อีกคนหนึ่ง แม้ว่าคอมพิวเตอร์จะไม่เข้าใจสิ่งที่มันบอกอย่างแท้จริง (Eliza ให้คำตอบเป็นสคริปต์)

“ ฉันคิดว่ามันน่าดึงดูดเช่นเดียวกับเกมแห่งโอกาสที่น่าดึงดูดหรือเกมปาร์ตี้” ฮิกส์กล่าว “มีระดับของความไม่แน่นอนเกี่ยวกับสิ่งที่จะเกิดขึ้น”

แต่ฮิกส์กังวลเกี่ยวกับความสามารถของระบบ AI ในการตอบสนองต่อข้อความแจ้งที่เป็นลายลักษณ์อักษรพร้อมรูปภาพ แทนที่จะให้ข้อความแสดงข้อผิดพลาดเป็นครั้งคราวเพื่อระบุว่าไม่ทราบวิธีแยกวิเคราะห์วลีที่บุคคลที่พิมพ์ “นั่นหมายความว่าคุณจะได้รับขยะในบางครั้ง” พวกเขากล่าว และหน้าที่เป็นความรับผิดชอบของผู้ใช้ที่จะหาสาเหตุ นี่เป็นกรณีที่มีคำแนะนำบางอย่างที่ฉันป้อนให้กับ Craiyon ทำให้บางครั้งน่าผิดหวังและน่าผิดหวังที่จะใช้ แต่ Dayma ชี้ให้เห็นว่ามันไม่ง่ายเลยที่จะคาดเดาสิ่งที่วาดได้หรือวาดไม่ได้ และบางครั้งผลลัพธ์ก็น่าประหลาดใจหรืออย่างน้อย แปลกอย่างน่าประหลาด.

Dayma กล่าวว่าเขาได้ยินจากคนที่ใช้ Craiyon ในการสร้างโลโก้สำหรับธุรกิจใหม่และเป็นภาพในวิดีโอ (OpenAI และ Google ได้แนะนำว่าในที่สุดระบบของพวกเขาอาจถูกใช้สำหรับสิ่งต่าง ๆ เช่นการแก้ไขภาพและสร้างภาพสต็อก)

ภาพที่แสดงให้เห็นว่าระบบ AI ของ Craiyon ซึ่งเดิมเรียกว่า DALL-E Mini นั้นสร้างภาพได้ดีขึ้นเมื่อเวลาผ่านไปอย่างไรสำหรับข้อความแจ้ง "หอไอเฟลกำลังลงจอดบนดวงจันทร์"

แม้ว่าระบบ AI เหล่านี้อาจมีความเป็นไปได้ที่สร้างสรรค์ แต่ก็มีปัญหาสำคัญที่แพร่หลายไปทั่วอุตสาหกรรม AI: ความลำเอียง พวกเขาทั้งหมดได้รับการฝึกอบรมเกี่ยวกับข้อมูลที่มีแนวกว้างของอินเทอร์เน็ต ซึ่งหมายความว่ารูปภาพที่พวกเขาสร้างขึ้นสามารถแสดงอคติได้หลายอย่าง เช่น เพศ เชื้อชาติ และแบบแผนทางสังคม

อคติดังกล่าวปรากฏชัดแม้ในภาพที่ดูคลุมเครือของ Craiyon และเนื่องจากทุกคนสามารถพิมพ์อะไรก็ได้ที่พวกเขาต้องการ มันอาจเป็นหน้าต่างที่รบกวนว่าการเหมารวมสามารถซึมเข้าไปใน AI ได้อย่างไร เมื่อเร็ว ๆ นี้ฉันได้ให้ “ทนายความ” แก่ Craiyon และผลลัพธ์ทั้งหมดเป็นภาพที่ไม่ชัดเจนของสิ่งที่ดูเหมือนจะเป็นผู้ชายในชุดคลุมของผู้พิพากษาผิวดำ ในขณะเดียวกัน “ครู” ก็ให้ผลเฉพาะตัวเลขที่ดูเหมือนจะเป็นผู้หญิง แต่ละคนสวมเสื้อเชิ้ตแบบมีกระดุม

เดย์มะรู้เรื่องนี้ดี ส่วน “คำถามที่พบบ่อย” ในเว็บไซต์ของ Craiyon ระบุว่าโมเดลที่พึ่งพาข้อมูลอินเทอร์เน็ตอาจส่งผลให้เกิด “ภาพที่มีลักษณะเหมารวมที่เป็นอันตราย” และผู้ที่อยู่เบื้องหลัง Craiyon กำลังทำงานเพื่อบันทึกและวิเคราะห์อคติ Dayma ตั้งข้อสังเกตว่าระบบ AI จำนวนมากมีอคติ ไม่ว่าผู้ใช้จะรับรู้หรือไม่ก็ตาม และกล่าวว่าเขาชอบที่ทุกคนสามารถสังเกตอคติของ Craiyon ได้โดยตรงจากภาพที่มันสร้างขึ้น

เขายังบอกด้วยว่าเขาพยายามป้องกันไม่ให้โมเดลที่อยู่เบื้องหลัง Craiyon เรียนรู้แนวคิดบางอย่างเพื่อเริ่มต้น อย่างไรก็ตาม ฉันใช้เวลาเพียงไม่กี่นาทีในการแสดงข้อความแจ้งที่ชัดเจนซึ่งให้ภาพที่พูดตรงๆ ว่าไม่ปลอดภัยสำหรับการทำงาน

เมื่อถูกถามว่าเขาคิดว่าการมีอยู่ทั่วไปของภาพดังกล่าวอาจเป็นสิ่งที่ไม่ดีหรือไม่ เนื่องจากมีอคติที่ชัดเจน เขาชี้ให้เห็นว่าภาพที่ปรากฏขึ้นในขณะที่ดูดีกว่าในอดีตนั้นไม่สมจริงอย่างชัดเจน

“ถ้าฉันวาดหอไอเฟลบนดวงจันทร์ ฉันหวังว่าไม่มีใครเชื่อว่าหอไอเฟลอยู่บนดวงจันทร์จริงๆ” เขากล่าว



     

คำแนะนำการอ่านบทความนี้ : บางบทความในเว็บไซต์ ใช้ระบบแปลภาษาอัตโนมัติ คำศัพท์เฉพาะบางคำอาจจะทำให้ไม่เข้าใจ สามารถเปลี่ยนภาษาเว็บไซต์เป็นภาษาอังกฤษ หรือปรับเปลี่ยนภาษาในการใช้งานเว็บไซต์ได้ตามที่ถนัด บทความของเรารองรับการใช้งานได้หลากหลายภาษา หากใช้ระบบแปลภาษาที่เว็บไซต์ยังไม่เข้าใจ สามารถศึกษาเพิ่มเติมโดยคลิกลิ้งค์ที่มาของบทความนี้ตามลิ้งค์ที่อยู่ด้านล่างนี้


ที่มาบทความนี้

spot_imgspot_img
RELATED ARTICLES
- Advertisment -
Technical Summary Widget Powered by Investing.com

ANALYSIS TODAY

Translate »