หยูหยาง รายงานจาก Ao Fei Si
Quantum Bit | WeChat Official Account: QbitAI
GPT-Image-2 ซึ่งเจ๋งกว่า Nano Banana เพิ่งเปิดตัวอย่างเป็นทางการ!
โปรดทราบ นี่ไม่ใช่ภาพหน้าจอ นี่ไม่ใช่ภาพหน้าจอ:

พิมพ์คำสั่ง “สร้างภาพหน้าจอการสนทนากับ GPT” คุณจะได้:

ลองดูภาพหน้าจอ TikTok สั้นๆ แบบนี้:

ใครจะแยกออกว่าจริงหรือปลอม? จุดสำคัญคือ ไม่มีภาพอ้างอิง และ คำสั่งสั้นมาก: สร้างภาพหน้าจอวิดีโอสอนแต่งหน้าบน TikTok
ชื่อผลิตภัณฑ์อย่างเป็นทางการที่ทางบริษัทให้คือ ChatGPT Images 2.0
เมื่อดูวิดีโอโปรโมตยาว 1 นาที 49 วินาทีอย่างละเอียด จะพบว่าโมเดลสร้างภาพใหม่นี้ ทำให้กระบวนการที่ซับซ้อนกลายเป็นเพียงคำสั่งเดียวและไม่กี่วินาที…
ครั้งนี้ นักออกแบบต้องวางแผนยุค “Vibe Coding” ในวงการออกแบบอย่างจริงจังแล้ว…
ทดสอบจริง: คำสั่งสั้น ผลลัพธ์ทรงพลัง
ตามคำอธิบายอย่างเป็นทางการ ChatGPT Images 2.0 เป็นโมเดลภาพแรกของ OpenAI ที่มีความสามารถในการ “คิด”
การเพิ่มความสามารถในการคิด ทำให้โมเดลจัดการงานที่ซับซ้อนมากขึ้น มีประสิทธิภาพดีขึ้นในด้านความแม่นยำ ความทันเวลา ความสอดคล้อง และความต่อเนื่องทางภาพ
พูดง่ายๆ คือ ปลอมจนแยกไม่ออก และเป็นเครื่องมือการผลิตที่แท้จริง
เพื่อทดสอบว่า ChatGPT Images 2.0 ปลอมได้ขนาดไหน เรามาทำการทดสอบง่ายๆ:

1, 2, 3…
ด้านซ้ายสร้างโดย ChatGPT Images 2.0 ด้านขวาเป็นหน้าจริง เมื่อมองครั้งแรก คุณเดาถูกไหม?
แม้จะมีข้อบกพร่องเล็กน้อยในข้อความที่สร้าง แต่ในด้านการพลิกโฉมเวิร์กโฟลว์การออกแบบ ต้องบอกว่า GPT-Image-2 หลังจาก Nano Banana ได้ดึงแถบประวัติศาสตร์ไปอีกไกล
ต่อไป เราจะเข้าสู่สถานการณ์การผลิตที่สมจริงยิ่งขึ้น
โฆษณาสินค้า
Quantum Bit เพิ่งปรับปรุงเวอร์ชันเสื้อยืดของแบรนด์ เราให้งานนี้กับ ChatGPT Images 2.0 มาดูว่าทำได้ดีแค่ไหน
คำสั่ง: ออกแบบเสื้อยืดสั่งทำพิเศษสำหรับ Quantum Bit สร้างภาพโปรโมต

มีข้อความภาษาจีนจำนวนมากในภาพ แต่ไม่มีข้อผิดพลาดเลย และโดยไม่ต้องเพิ่มข้อมูลพื้นหลังของ Quantum Bit ดูเหมือน ChatGPT Images 2.0 รวบรวมข้อมูลจากอินเทอร์เน็ตเอง ตั้งแต่โลโก้ไปจนถึงตำแหน่ง
โปสเตอร์论文
เพิ่มความซับซ้อนอีกนิด ส่งบทความให้ ChatGPT ตีความและสร้างโปสเตอร์โปรโมตที่เกี่ยวข้อง

ภาพยาวที่ซับซ้อนเช่นนี้ ChatGPT Images 2.0 ก็สร้างสำเร็จในครั้งเดียวด้วยคำสั่งสั้นๆ
และด้วยความสามารถในการค้นหาออนไลน์ ในบางสถานการณ์ การใช้ ChatGPT Images 2.0 สร้างโปสเตอร์หรือการ์ดที่มีข้อมูลมากมาย อาจช่วยประหยัดขั้นตอนการรวบรวมข้อมูลเอง
เช่น “สร้างโปสเตอร์แนะนำวิธีการเล่น Genshin Impact ในสไตล์ทางการ”

วิธีเล่นเพิ่มเติม
แน่นอน ถ้าคิดนอกกรอบ ChatGPT Images 2.0 ยังสามารถทำอะไรที่บ้าๆ ได้อีกมาก
เช่น สร้างการบ้าน…

มันไม่ได้ให้คำตอบแบบสุ่ม ลองคำนวณดูสิ…
~~(แม่ไม่ต้องกังวลว่าการบ้านฉันจะไม่พอเขียน)~~
วิธีเล่นที่ผู้ใช้ค้นพบยังรวมถึงการสร้างภาพ 360 องศา:

奥特曼 เองก็โพสต์การ์ตูน 4 ช่องที่สร้างด้วย ChatGPT Images 2.0 เกี่ยวกับเรื่องราวทีม

จากการทดสอบจริง สรุปของทางการไม่ได้โอ้อวดเกินจริง มีท่าทีว่า “OpenAI กลับมาแล้ว” จริงๆ:
- นำเสนอความละเอียดและความเที่ยงตรงที่ก้าวล้ำสำหรับการสร้างภาพ ใน API ChatGPT Images 2.0 รองรับการสร้างภาพความละเอียดสูงสุด 2K
- มีความสามารถในการเข้าใจหลายภาษาที่ดีขึ้น
- รองรับอัตราส่วนภาพกว้างสุด 3:1 และแคบสุด 1:3
- แนะนำความรู้โลกที่อัปเดต ข้อมูล截止ถึงธันวาคม 2025
- สามารถสร้างผลลัพธ์ได้สูงสุด 8 รายการต่อคำสั่ง และตัวละครและวัตถุในภาพคงความต่อเนื่อง
นอกจากนี้ ในสนามประลองโมเดลใหญ่ ChatGPT Images 2.0 ขึ้นอันดับหนึ่ง และในงานข้อความเป็นภาพ นำหน้า Nano Banana 2 อันดับสองถึง 240 คะแนน

ตอนนี้ ChatGPT Images 2.0 เปิดให้บริการเต็มรูปแบบใน ChatGPT, Codex และ OpenAI API ราคา API เฉพาะดังนี้:

ทีมวิจัยเบื้องหลัง GPT-Image-2
ในการเปิดตัว ChatGPT Images 2.0 ครั้งนี้ ข้าง奥特曼 เต็มไปด้วยใบหน้าชาวตะวันออก

หัวหน้าทีมวิจัยคือ Gabriel Goh (คนที่สองจากขวา) เขาจบปริญญาเอกสาขาคณิตศาสตร์จาก University of California, Davis และเข้าร่วม OpenAI ในปี 2019 หลังจากลาออกจาก Apple
ในบรรดาผู้ที่ปรากฏตัว ยังมีชาวจีนอยู่เสมอ
Chen Boyuan มาจาก Jiangsu เป็นนักวิจัยวิทยาศาสตร์ของ OpenAI จบปริญญาตรีจาก Berkeley และปริญญาเอกจาก MIT

งานวิจัยของเขาเน้นที่โมเดลโลก ปัญญาประดิษฐ์แบบมีกาย และการเรียนรู้แบบเสริมกำลัง นอกจากงานวิจัย เขายังเป็นเชฟที่รักชานมไข่มุก

อีกหนึ่งเรื่อง ตามข้อมูลในโปรไฟล์ส่วนตัวของ Chen Boyuan ทีมโมเดลสร้างภาพ GPT ดูเหมือนจะมีจำนวนไม่มาก:
ฉันเป็นหนึ่งในนักวิจัยไม่กี่คนที่ฝึกโมเดลสร้างภาพ GPT
ลิงก์อ้างอิง:
[1] https://openai.com/index/introducing-chatgpt-images-2-0/#textmode
[2] https://x.com/OpenAI/status/2046670977145372771
กดสามครั้ง “ถูกใจ” “แชร์” “หัวใจ”
ยินดีต้อนรับความคิดเห็นของคุณในช่องแสดงความคิดเห็น!
— จบ —
🔹 ใครจะเป็นตัวแทนของ AI ในปี 2026?
กุ้งมังกรได้รับความนิยม ผลักดันคลื่นของ Agent และผลิตภัณฑ์ที่เกี่ยวข้อง
แต่บริษัทและผลิตภัณฑ์ AI ที่ควรจับตามองในระยะยาว อาจมีมากกว่านี้
ถ้าคุณกำลังทำหรือเห็นการเปลี่ยนแปลงเหล่านี้ ยินดีต้อนรับสมัคร
ให้คนอื่นเห็นคุณ 👉 https://wj.qq.com/s2/25829730/09xz/

กดติดตาม 👇 เปิดดาว พบกับความก้าวหน้าทางเทคโนโลยี前沿ทุกวัน
⚠️ หมายเหตุ: เนื้อหาได้รับการแปลโดย AI และตรวจสอบโดยมนุษย์ หากมีข้อผิดพลาดโปรดแจ้ง
☕ สนับสนุนค่ากาแฟทีมงาน
หากคุณชอบบทความนี้ สามารถสนับสนุนเราได้ผ่าน PromptPay
本文来自网络搜集,不代表คลื่นสร้างอนาคต立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/th/archives/31524
