โมเดลขนาดใหญ่แบบหลายรูปแบบ
-
SWE-Vision: เปิดโลกทัศน์ให้โมเดลใหญ่ “มองเห็น” ด้วยโค้ด ปรับปรุงสถิติ SOTA ในห้ามาตรฐานการมองเห็น
โมเดลขนาดใหญ่แบบหลายรูปแบบ (Multimodal Large Models) ได้ก้าวหน้าไปอย่างมากในด้านการสร้างและทำความเข้าใจโค้ด แต่ประสิทธิภาพของโมเดลเหล่านี้ในงานพื้นฐานทางด้านการมองเห็น (Vision) มัก…
-
EgoSound: เปิดตัวมาตรฐานการประเมินการรับรู้เสียงมุมมองบุคคลที่หนึ่งเป็นครั้งแรก วัดระดับปัญหา ‘หูหนวก’ ของโมเดลขนาดใหญ่หลายรูปแบบ ช่องว่างระหว่างโมเดลที่แข็งแกร่งที่สุดกับมนุษย์เกิน 27%
EgoSound: เปิดตัวมาตรฐานการประเมินความเข้าใจเสียงมุมมองบุคคลที่หนึ่งเป็นครั้งแรก ปัญหา “หูหนวก” ของโมเดลใหญ่หลายรูปแบบถูกวัดผลเชิงปริมาณ เมื่อโมเดลใหญ่หลายรูปแบบก้าวเข้…
-
มหาวิทยาลัยชิงหว่าร่วมกับ Meituan เปิดตัว 3DThinker: กรอบงานที่ก้าวล้ำครั้งแรกที่ทำให้โมเดลขนาดใหญ่ “จินตนาการ” ฉากสามมิติ
เมื่อได้รับภาพฉากหลายๆ ภาพ มนุษย์มักสามารถจินตนาการโครงร่างสามมิติของฉากนั้นในใจได้ อย่างไรก็ตาม โมเดลขนาดใหญ่แบบหลายรูปแบบ (Multimodal) ในปัจจุบันยังคงอาศัยการให้เหตุผลจากข้อมูลข้…
-
ReVision Breakthrough: การจัดเรียงทางเรขาคณิตปลดล็อกกระบวนทัศน์ใหม่ในการฝึกโมเดลขนาดใหญ่หลายรูปแบบโดยไม่ต้องจับคู่ภาพและข้อความ
ไม่ต้องจับคู่ภาพกับข้อความ การจัดเรียงทางเรขาคณิตปลดล็อกกระบวนทัศน์ใหม่ในการฝึกฝนโมเดลขนาดใหญ่หลายรูปแบบ ในการวิจัยและพัฒนาของโมเดลขนาดใหญ่หลายรูปแบบ (MLLM) มีฉันทามติมายาวนานว่า: …
-
MiniCPM-o 4.5: โมเดลโอเพนซอร์สพารามิเตอร์ 9B รองรับทุกโหมด ทางเลือกแทน GPT-4o บนอุปกรณ์ปลายทาง
MiniCPM-o 4.5: โมเดลโอเพ่นซอร์สออลโมดัลขนาด 9B พารามิเตอร์ ทางเลือกแทน GPT-4o บนอุปกรณ์ปลายทาง MiniCPM-o 4.5 เป็นโมเดลเรือธงออลโมดัลรุ่นใหม่ที่เปิดตัวโดย OpenBMB ของ Mianbi AI โดยม…
-
Meituan STAR โมเดลขนาดใหญ่: ฝ่าด่านภาวะศูนย์รวม ‘ความเข้าใจ-การสร้าง’ แบบหลายรูปแบบ คะแนน GenEval สูงกว่า 0.91
เมื่อเร็วๆ นี้ Meituan ได้เปิดตัวโซลูชันโมเดลใหญ่แบบหลายรูปแบบแบบรวมศูนย์ใหม่ STAR (STacked AutoRegressive Scheme for Unified Multimodal Learning) ด้วยการออกแบบหลักสองประการที่เป็น…
-
MiniCPM-o 4.5 จาก Mianbi Open Source: โมเดลขนาดใหญ่แบบ Full-Duplex และ Full-Modal พร้อมพารามิเตอร์ 9B ที่สร้างประสบการณ์การโต้ตอบ “เหมือนมนุษย์จริง” เปิดยุคใหม่ของการสนทนาระหว่างมนุษย์และเครื่องจักร
คุณเคยคิดถึงปัญหานี้ไหม: ทำไมเวลาคุยกับ AI ถึงรู้สึกขาด ‘ความเป็นมนุษย์’ ไปนิด? ไม่ใช่เพราะมันตอบไม่ถูกต้อง หรือไม่เข้าใจสิ่งที่คุณพูด แต่เพราะทุกการโต้ตอบดูแข็งทื่อเกิ…