DeepSeek เปิดตัวโหมด識ภาพกะทันหัน วงการ AI สั่นสะเทือน: วาฬตัวนี้ลืมตาแล้ว!

2 hours ago • ข่าวสารอุตสาหกรรม AI • 10 views

คิดว่าการอัปเดต AI ครั้งใหญ่ของ DeepSeek รอบนี้คงจะจบลงแล้ว แต่ไม่มีใครคาดคิดว่าหลังจากเพิ่งปล่อยเวอร์ชัน V4 เมื่อสัปดาห์ที่แล้ว มันกลับสร้างเซอร์ไพรส์ที่ใหญ่กว่าเดิมอีกครั้ง

DeepSeek เปิดตัวโหมด識ภาพกะทันหัน วงการ AI สั่นสะเทือน: วาฬตัวนี้ลืมตาแล้ว!

เมื่อไม่กี่นาทีที่ผ่านมา DeepSeek ได้เปิดตัวโหมด識รูปอย่างเป็นทางการ ซึ่งขณะนี้อยู่ในขั้นตอนการทดสอบแบบ灰度 ซึ่งหมายความว่าความสามารถ multimodal ของ DeepSeek ที่วงการพูดถึงกันมาทั้งปี ได้เริ่มใช้งานได้จริงแล้ว!

DeepSeek เปิดตัวโหมด識ภาพกะทันหัน วงการ AI สั่นสะเทือน: วาฬตัวนี้ลืมตาแล้ว!

ปัจจุบัน หลังจากอัปเดตเว็บไซต์และแอป DeepSeek ผู้ใช้บางส่วนอาจถูกสุ่มให้เข้าถึงฟีเจอร์ใหม่นี้ APPSO ได้ทดสอบทันที Chen Xiaokang นักวิจัยด้าน multimodal ของ DeepSeek โพสต์บน X ว่า “Now, we see you” พร้อมรูปภาพหนึ่งรูป เราจึงให้ DeepSeek ตีความความหมายเบื้องหลังรูปนี้ด้วยตัวเอง

DeepSeek เปิดตัวโหมด識ภาพกะทันหัน วงการ AI สั่นสะเทือน: วาฬตัวนี้ลืมตาแล้ว!

ผลลัพธ์แสดงให้เห็นว่ามันสามารถระบุอุปมาอุปไมยที่ซ่อนอยู่ในรูปได้ แม้ว่ารูปจะไม่มีข้อความใดที่กล่าวถึง DeepSeek โดยตรง แต่ด้วยการรวมข้อมูลผู้โพสต์และเนื้อหาของรูป มันสรุปได้ว่านี่คือการอัปเดตเกี่ยวกับความสามารถ multimodal ของ DeepSeek สุดท้าย มันให้บทสรุปที่แม่นยำมาก: “ปลาวาฬที่มองไม่เห็นโลก ตอนนี้ลืมตาแล้ว”

DeepSeek เปิดตัวโหมด識ภาพกะทันหัน วงการ AI สั่นสะเทือน: วาฬตัวนี้ลืมตาแล้ว!

เมื่อเทียบกับคำตอบสุดท้าย APPSO พบว่ากระบวนการคิดของโหมด識รูปของ DeepSeek กลับน่าสนใจกว่า

DeepSeek เปิดตัวโหมด識ภาพกะทันหัน วงการ AI สั่นสะเทือน: วาฬตัวนี้ลืมตาแล้ว!

เลื่อนขึ้นลงเพื่อดูกระบวนการคิดทั้งหมด ในอดีต เมื่อ AI เห็นภาพแคปหน้าจอจาก Twitter มันมักจะอธิบายอย่างตรงไปตรงมา: “ปลาวาฬสีน้ำเงินสองตัว ตัวซ้ายใส่ผ้าปิดตา ตัวขวาไม่ใส่” แต่ DeepSeek กลับเริ่มตั้งคำถามทันที: คนนี้คือใคร? ทำไมเขาถึงโพสต์สิ่งนี้? โลโก้ปลาวาฬหมายถึงอะไร? XX บนผ้าปิดตาบอกใบ้อะไร?

DeepSeek เปิดตัวโหมด識ภาพกะทันหัน วงการ AI สั่นสะเทือน: วาฬตัวนี้ลืมตาแล้ว!

นี่คือสิ่งที่เกิดขึ้นจริงในสมองของเราเมื่อเราเห็นมีม ไม่มีใครนับก่อนว่ามีปลาวาฬกี่ตัว เราสนใจว่าใครพูดกับใคร และมีนัยอะไรซ่อนอยู่ในคำพูด และมันยังแก้ไขตัวเองซ้ำแล้วซ้ำเล่า เช่น มันเคยเชื่อมโยงผ้าปิดตาในรูปกับแว่นตาของคามินะจาก “Tengen Toppa Gurren Lagann” แล้วก็หักล้างตัวเอง: “ไม่ มันดูโอตาคุเกินไป” “เดี๋ยวก่อน ดูดีๆ…” “เปลี่ยนมุมมองอีกที…” การอนุมาน การเชื่อมโยง และการแก้ไขตัวเองในช่วงแรกนั้นยอดเยี่ยมพอแล้ว แต่ส่วนที่ขัดกับสามัญสำนึกที่สุดในกระบวนการคิดทั้งหมดคือ เมื่อการอนุมานใกล้จะจบ มันก็หยุดตัวเองและจัดการประชุมสอบขนาดเล็ก

DeepSeek เปิดตัวโหมด識ภาพกะทันหัน วงการ AI สั่นสะเทือน: วาฬตัวนี้ลืมตาแล้ว!

มันตั้งคำถามสามข้อและตอบเอง: ยืนยันข้อเท็จจริงก่อน จากนั้นคาดเดาลักษณะของเหตุการณ์ และสุดท้ายจึงตีความ DeepSeek นำนิสัยการคิดที่เราเองก็ไม่รู้ตัวนี้ มาใช้เป็นตรรกะการคิดของโหมด識รูป เหมือนกับที่สมองของเราจะตรวจสอบก่อนสรุป: “เดี๋ยวก่อน ข้อสันนิษฐานนี้ถูกต้องไหม? สมมติฐานนั้นยืนหยัดได้ไหม? ถ้าฉันเข้าใจผิดล่ะ?” เรายังทดสอบ DeepSeek ด้วยคำถามคลาสสิกของ AI—การนับนิ้ว

DeepSeek เปิดตัวโหมด識ภาพกะทันหัน วงการ AI สั่นสะเทือน: วาฬตัวนี้ลืมตาแล้ว!

มันคิดอยู่พักหนึ่งแล้วตอบผิด พร้อมบ่นระหว่างทาง: “ฉันนับจนมึนแล้วจริงๆ” อย่างไรก็ตาม ถ้าฉันแนะนำเล็กน้อย มันก็ยังให้คำตอบที่ถูกต้องได้

DeepSeek เปิดตัวโหมด識ภาพกะทันหัน วงการ AI สั่นสะเทือน: วาฬตัวนี้ลืมตาแล้ว!

ในการทดสอบนับนิ้วอีกครั้ง หลังจากตอบผิดครั้งแรก ฉันไม่ได้ให้คำตอบ แค่ให้มันคิดอีกครั้ง มันก็ตอบถูก

DeepSeek เปิดตัวโหมด識ภาพกะทันหัน วงการ AI สั่นสะเทือน: วาฬตัวนี้ลืมตาแล้ว!

DeepSeek เปิดตัวโหมด識ภาพกะทันหัน วงการ AI สั่นสะเทือน: วาฬตัวนี้ลืมตาแล้ว!

เรายังลองทดสอบ “รูปหัวใจ” แบบคลาสสิก รูปนี้เคยทำให้ AI ทุกตัวล้มเหลวมาก่อน DeepSeek ก็ไม่สามารถระบุได้เช่นกัน

DeepSeek เปิดตัวโหมด識ภาพกะทันหัน วงการ AI สั่นสะเทือน: วาฬตัวนี้ลืมตาแล้ว!

นอกจากการทดสอบขีดจำกัดที่ยากเหล่านี้แล้ว จากการทดสอบเบื้องต้นของ APPSO ความแม่นยำของโหมด識รูปของ DeepSeek ค่อนข้างสูง ถ้าไม่เปิดโหมดคิด ก็สามารถให้คำตอบได้ภายในครึ่งวินาที เช่น การระบุภาพนิ่งจากหนังนี้ น่าจะอยู่ในฐานข้อมูลของมันแล้ว

DeepSeek เปิดตัวโหมด識ภาพกะทันหัน วงการ AI สั่นสะเทือน: วาฬตัวนี้ลืมตาแล้ว!

ความเข้าใจในภาพนามธรรมก็ทำได้ดีมาก

DeepSeek เปิดตัวโหมด識ภาพกะทันหัน วงการ AI สั่นสะเทือน: วาฬตัวนี้ลืมตาแล้ว!

ความเข้าใจในภาพสินค้าของ Uniqlo นี้ก็ไม่มีปัญหา

DeepSeek เปิดตัวโหมด識ภาพกะทันหัน วงการ AI สั่นสะเทือน: วาฬตัวนี้ลืมตาแล้ว!

อย่างไรก็ตาม กระบวนการ識รูปดูเหมือนจะไม่มีการค้นหาออนไลน์ และตอบตามฐานความรู้เท่านั้น ดังนั้น เนื้อหาที่ใหม่กว่าบางอย่างจึงไม่สามารถระบุได้ เช่น มาสคอตตัวใหม่ของ Apple อย่าง Finder-chan

DeepSeek เปิดตัวโหมด識ภาพกะทันหัน วงการ AI สั่นสะเทือน: วาฬตัวนี้ลืมตาแล้ว!

นอกจากนี้ รูปแบบไฟล์ที่อัปโหลดในโหมด識รูปก็มีข้อจำกัด เช่น ไม่รองรับรูปแบบ HEIF

DeepSeek เปิดตัวโหมด識ภาพกะทันหัน วงการ AI สั่นสะเทือน: วาฬตัวนี้ลืมตาแล้ว!

การเปิดตัวโหมด識รูปของ DeepSeek หมายความว่าปลาวาฬตัวนี้ได้ลืมตาแล้ว แต่นี่อาจเป็นเพียงจุดเริ่มต้น ความสามารถ multimodal อื่นๆ ของ DeepSeek อาจจะอัปเดตตามมาในเร็วๆ นี้ เมื่อช่องว่างนี้ถูกเติมเต็ม โครงสร้างของโมเดลในประเทศอาจเปลี่ยนแปลงอย่างละเอียดอีกครั้ง APPSO จะแชร์ประสบการณ์เพิ่มเติมเกี่ยวกับโหมด識รูปของ DeepSeek ต่อไป และยินดีต้อนรับทุกท่านที่ทดลองใช้แล้วมาแบ่งปันเคล็ดลับและรายละเอียดที่น่าสนใจกับเรา

DeepSeek เปิดตัวโหมด識ภาพกะทันหัน วงการ AI สั่นสะเทือน: วาฬตัวนี้ลืมตาแล้ว!

⚠️ หมายเหตุ: เนื้อหาได้รับการแปลโดย AI และตรวจสอบโดยมนุษย์ หากมีข้อผิดพลาดโปรดแจ้ง

☕ สนับสนุนค่ากาแฟทีมงาน

หากคุณชอบบทความนี้ สามารถสนับสนุนเราได้ผ่าน PromptPay

PromptPay QR

SCAN TO PAY WITH ANY BANK

本文来自网络搜集，不代表คลื่นสร้างอนาคต立场，如有侵权，联系删除。转载请注明出处：http://www.itsolotime.com/th/archives/32717

Like (0)

0 0

อเมซอน เว็บ เซอร์วิสเซส เปิดตัวครั้งใหญ่: ผู้ช่วย AI Amazon Q เชื่อมระบบนิเวศ โมเดล OpenAI เชื่อมต่อ Bedrock เป็นครั้งแรก

Previous 10 hours ago

Apple AI แก้ไขภาพเปิดตัวแล้ว iOS 27 ต้อนรับฟีเจอร์ AI อย่างเต็มรูปแบบ

Next 2 hours ago

ข่าวสารอุตสาหกรรม AI

Vibe Coding ในทางปฏิบัติ: วิธีทำให้ AI หลีกหนี “โครงการกองขยะ” คู่มือการเขียนโปรแกรมเชิงวิศวกรรมที่มือใหม่ก็สามารถควบคุมได้

เมื่อไม่นานมานี้ กระแส Vibe Coding กำลังมาแรง ผู้เริ่มต้นที่ไม่ใช่สายเทคนิคหลายคนก็เริ่มใช้ AI ทำงานกันเต็มที่: “ช่วยเขียนระบบให้หน่อย” “ช่วยทำเว็บไซต์ให้หน่อย&#8…

2026年2月20日
269000
ข่าวสารอุตสาหกรรม AI

ซีรี่ย์โมเดล MiMo-V2 ของ Xiaomi เปิดตัวแบบไม่ระบุตัวตนทำให้เกิดการคาดเดา สามโมเดลเปิดตัวพร้อมกันผลักดัน AI จากบทสนทนาไปสู่การปฏิบัติภารกิจ

สัปดาห์ที่แล้ว มีโมเดลที่ไม่ระบุชื่อสองตัวปรากฏตัวบนแพลตฟอร์มรวม API ชื่อดังอย่าง OpenRouter โดยใช้รหัสว่า “Hunter Alpha” และ “Healer Alpha” โดยไม่มีการประช…

2026年3月19日
250000
ข่าวสารอุตสาหกรรม AI

โมเดลจีน GLM-5.1 เกิดข้อโต้แย้งเรื่องราคาต่างประเทศ: ผู้ใช้จีน 469 หยวน ผู้ใช้ตะวันตก 160 ดอลลาร์ หัวหน้าฝ่าย Hugging Face ยืนยันประสิทธิภาพ

โมเดลจีน GLM-5.1 กำหนดราคาต่างประเทศก่อให้เกิดข้อโต้แย้ง: ผู้ใช้จีน 469 หยวน ผู้ใช้ตะวันตก 160 ดอลลาร์ เมื่อเร็วๆ นี้ กลยุทธ์การกำหนดราคาของโมเดลขนาดใหญ่จีน GLM-5.1 ได้ก่อให้เกิดกา…

2026年4月15日
98000
ข่าวสารอุตสาหกรรม AI

Google ICLR งานวิจัยชั้นนำตกอยู่ในกระแสการลอกเลียน: เทคโนโลยีหลัก TurboQuant ถูกกล่าวหาว่าถูกเสนอโดยทีม ETH เมื่อสองปีก่อน ก่อให้เกิดความสั่นสะเทือนในวงการวิชาการ AI

ความปั่นป่วนที่พัดผ่านตลาด ได้ดึงเอาการโต้เถียงทางวิชาการออกมาโดยไม่คาดคิด เย็นวันศุกร์นี้ งานวิจัยของทีมวิจัยกูเกิลตกอยู่ภายใต้ข้อกล่าวหาการประพฤติมิชอบทางวิชาการ กลายเป็นจุดสนใจข…

2026年3月29日
200000
ข่าวสารอุตสาหกรรม AI

แนวโน้มใหม่ของการตลาด AI: วิธีที่ Kuaishou Business AI เชื่อมโยงห่วงโซ่ทั้งหมดและแก้ปัญหาความร่วมมือในอุตสาหกรรม

แนวโน้มใหม่ของการตลาด AI: AI ธุรกิจของ Kuaishou เชื่อมโยงห่วงโซ่ทั้งหมดอย่างไร เพื่อแก้ปัญหาการทำงานร่วมกันในอุตสาหกรรม AI เข้าสู่อุตสาหกรรมการตลาด เป็นเรื่องที่ชัดเจนแล้ว ข้อมูลกา…

2026年3月31日
108000