มีคลิปที่ดูสมจริงแพร่กระจายในโลกออนไลน์: อีลอน มัสก์ ไลฟ์ขายสินค้า Lao Gan Ma บน TikTok โดยมีผู้ชมจำนวนมาก; เขามีคอลแลปกับเกมยอดนิยมอย่าง GTA 6 และปรากฏตัวในเมืองเสมือนจริง; แม้กระทั่งยืนเคียงข้าง “อุลตร้าแมน” ที่เขารัก




อย่างไรก็ตาม ทั้งหมดนี้เป็นเรื่องไม่จริง ไม่มีการไลฟ์สด ไม่มีคอมเมนต์弹幕 และภาพจากเกมก็ไม่ใช่ของจริง ภาพเหล่านี้ที่แทบแยกไม่ออกทั้งหมดถูกสร้างขึ้นโดยโมเดลสร้างภาพล่าสุดของ OpenAI ที่ชื่อ GPT Image 2 เทคโนโลยีการสร้างภาพด้วย AI ดูเหมือนจะก้าวข้ามขีดจำกัดสำคัญไปแล้ว สมัยที่ “มีภาพเป็นหลักฐาน” อาจกำลังจะถึงจุดจบ
เมื่อ AI กลายเป็น “สิ่งที่มองไม่เห็น”
สิ่งที่ทำให้ GPT Image 2 น่าทึ่งที่สุดคือความ “มองไม่เห็น” ของมัน เมื่อเห็นภาพที่มันสร้างขึ้น ปฏิกิริยาแรกมักไม่ใช่การทึ่งในเทคโนโลยี แต่คือการที่เราไม่รู้ตัวเลยว่ามันถูกสร้างโดย AI จนกว่าจะมีคนบอกความจริง ผู้ชมจึงจะถึง “ช่วงเวลาแห่งการตระหนักรู้” ครั้งแรก
ตามมาด้วยช่วงเวลาแห่งการตระหนักรู้ครั้งที่สอง: แม้จะพิจารณาอย่างละเอียด ก็แทบจะหาจุดบกพร่องทั่วไปของ AIGC ไม่พบ ตัวอย่างเช่น ภาพหน้าปกวารสารแฟชั่น ตั้งแต่ภาพบุคคล เครื่องประดับ พื้นหลัง ไปจนถึงการจัดวางตัวอักษร สำหรับคนทั่วไปแล้วแทบจะไม่ต่างจากสิ่งพิมพ์จริงเลย

ภาพหน้าจอเกมที่เลียนแบบ Minecraft องค์ประกอบ UI ต่างๆ เช่น แถบเลือด ค่าความหิว ถูกสร้างขึ้นมาได้อย่างสมบูรณ์แบบ แม้แต่เอกสารลับชื่อ “Claude Opus 5” ที่ตัวละครถืออยู่ ข้อความบนนั้นก็สื่อความหมายได้อย่างมีเหตุผล

โมเดลนี้มีความสามารถโดดเด่นในการสร้างข้อความที่ต่อเนื่องและแม่นยำ ภาพสมุดบันทึกประจำวันภาษาเกาหลี ไม่เพียงแต่การจัดองค์ประกอบดูสมจริงเท่านั้น เนื้อหาหลังแปลแล้วก็เป็นบันทึกประจำวันที่สมเหตุสมผล ภาพหน้าหนังสือพจนานุกรมภาษาจีน ความหนาแน่นของข้อมูลและความถูกต้องของการจัดหน้าก็สมจริงจนแยกไม่ออก


ความสามารถนี้เพิ่มประโยชน์ใช้สอยได้อย่างมาก ในสถานการณ์ที่ต้องการผสมผสานข้อมูลภาพและข้อความ เช่น การออกแบบ อีคอมเมิร์ซ ผู้ใช้สามารถสร้างโปสเตอร์หรือภาพแสดงสินค้าที่พร้อมใช้ได้แทบจะโดยไม่มีอุปสรรค




ความทะเยอทะยานที่ยิ่งใหญ่กว่า: การออกแบบส่วนหน้า
สำหรับ OpenAI แล้ว GPT Image 2 อาจ承载着承载着ความทะเยอทะยานด้านผลิตภัณฑ์ที่ยิ่งใหญ่กว่า นั่นคือการปฏิวัติการออกแบบ UI ส่วนหน้า ต่างจากสไตล์นามธรรมที่ GPT ถูกวิจารณ์บ่อยครั้งในการออกแบบ UI มาก่อน Image 2 แสดงให้เห็นถึงความสามารถในการ “เลียนแบบ” ที่สุดขีด
มันสามารถสร้างอินเทอร์เฟซซอฟต์แวร์ การออกแบบเว็บไซต์ หรือแม้กระทั่งภาพหน้าจอเดสก์ท็อประบบปฏิบัติการที่สมจริงจนแยกไม่ออก หากความสามารถนี้ถูกรวมเข้ากับเครื่องมือเขียนโปรแกรมอย่างลึกซึ้ง มันอาจเปลี่ยนแปลงขั้นตอนการพัฒนาอย่างสิ้นเชิง ทำให้สามารถสร้างจากคำอธิบายภาษาธรรมชาติไปจนถึงอินเทอร์เฟซภาพและโค้ดฟังก์ชันการทำงานแบบครบวงจรได้




มีสัญญาณบ่งชี้ว่า OpenAI อาจกำลังบูรณาการไปในทิศทางนี้ เครื่องมือสร้างโค้ดของพวกเขามีฟังก์ชันเบราว์เซอร์ในตัวและเชื่อมต่อกับความสามารถในการสร้างภาพแล้ว นี่อาจเป็นต้นแบบของการสร้างแอปพลิเคชันซูเปอร์มัลติโมดัลของพวกเขา โดยมีเป้าหมายเพื่อบูรณาการการเขียนโปรแกรมและการสร้างภาพในแนวดิ่ง

อย่างไรก็ตาม ปัจจุบัน GPT Image 2 ยังไม่ได้เปิดให้ผู้ใช้ ChatGPT Plus ทั่วไปเข้าถึง หากสาธารณชนต้องการทดลองใช้ จำเป็นต้องผ่านแพลตฟอร์มเฉพาะ
คาดเข็มขัดนิรภัยให้แน่น
ความสามารถของ GPT Image 2 ที่เพิ่มขึ้นนั้นยิ่งใหญ่ แต่สิ่งที่ควรครุ่นคิดมากกว่าคือขอบเขตที่มันก้าวข้าม: เมื่อเนื้อหาที่ AI สร้างขึ้นสามารถหลอกตาคนส่วนใหญ่ได้อย่างง่ายดาย สิ่งที่เรากำลังเผชิญคือโลกที่ความจริงและความเสมือนล้วนผสมผสานเข้าด้วยกันอย่างลึกซึ้ง
เกณฑ์ของอาชญากรรมโทรคมนาคมและการแพร่กระจายข้อมูลเท็จจะถูกลดต่ำลงอย่างไม่มีที่สิ้นสุด สมัยที่ผู้คนสามารถแยกแยะ “กลิ่นอายของ AI” ได้อย่างง่ายดาย บางทีอาจจบลงจริงๆ เราอาจต้องคาดเข็มขัดนิรภัยให้แน่น เพื่อต้อนรับภาวะปกติใหม่ที่ “มีภาพก็ไม่จำเป็นต้องมีความจริง”
ลิงก์อ้างอิง
[1]https://x.com/johnAGI168/status/2044781168151724067
⚠️ หมายเหตุ: เนื้อหาได้รับการแปลโดย AI และตรวจสอบโดยมนุษย์ หากมีข้อผิดพลาดโปรดแจ้ง
☕ สนับสนุนค่ากาแฟทีมงาน
หากคุณชอบบทความนี้ สามารถสนับสนุนเราได้ผ่าน PromptPay
本文来自网络搜集,不代表คลื่นสร้างอนาคต立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/th/archives/30972
