โมเดลขนาดใหญ่แบบหลายรูปแบบ

SWE-Vision: เปิดโลกทัศน์ให้โมเดลใหญ่ “มองเห็น” ด้วยโค้ด ปรับปรุงสถิติ SOTA ในห้ามาตรฐานการมองเห็น

โมเดลขนาดใหญ่แบบหลายรูปแบบ (Multimodal Large Models) ได้ก้าวหน้าไปอย่างมากในด้านการสร้างและทำความเข้าใจโค้ด แต่ประสิทธิภาพของโมเดลเหล่านี้ในงานพื้นฐานทางด้านการมองเห็น (Vision) มัก…

2026年3月16日

169000

การประเมินโมเดลขนาดใหญ่

EgoSound: เปิดตัวมาตรฐานการประเมินการรับรู้เสียงมุมมองบุคคลที่หนึ่งเป็นครั้งแรก วัดระดับปัญหา ‘หูหนวก’ ของโมเดลขนาดใหญ่หลายรูปแบบ ช่องว่างระหว่างโมเดลที่แข็งแกร่งที่สุดกับมนุษย์เกิน 27%

EgoSound: เปิดตัวมาตรฐานการประเมินความเข้าใจเสียงมุมมองบุคคลที่หนึ่งเป็นครั้งแรก ปัญหา “หูหนวก” ของโมเดลใหญ่หลายรูปแบบถูกวัดผลเชิงปริมาณ เมื่อโมเดลใหญ่หลายรูปแบบก้าวเข้…

2026年3月12日

163000

วิศวกรรมโมเดลขนาดใหญ่

มหาวิทยาลัยชิงหว่าร่วมกับ Meituan เปิดตัว 3DThinker: กรอบงานที่ก้าวล้ำครั้งแรกที่ทำให้โมเดลขนาดใหญ่ “จินตนาการ” ฉากสามมิติ

เมื่อได้รับภาพฉากหลายๆ ภาพ มนุษย์มักสามารถจินตนาการโครงร่างสามมิติของฉากนั้นในใจได้ อย่างไรก็ตาม โมเดลขนาดใหญ่แบบหลายรูปแบบ (Multimodal) ในปัจจุบันยังคงอาศัยการให้เหตุผลจากข้อมูลข้…

2026年3月11日

173000

การฝึกโมเดลขนาดใหญ่

ReVision Breakthrough: การจัดเรียงทางเรขาคณิตปลดล็อกกระบวนทัศน์ใหม่ในการฝึกโมเดลขนาดใหญ่หลายรูปแบบโดยไม่ต้องจับคู่ภาพและข้อความ

ไม่ต้องจับคู่ภาพกับข้อความ การจัดเรียงทางเรขาคณิตปลดล็อกกระบวนทัศน์ใหม่ในการฝึกฝนโมเดลขนาดใหญ่หลายรูปแบบ ในการวิจัยและพัฒนาของโมเดลขนาดใหญ่หลายรูปแบบ (MLLM) มีฉันทามติมายาวนานว่า: …

2026年3月3日

160000

ข่าวสารอุตสาหกรรม AI

MiniCPM-o 4.5: โมเดลโอเพนซอร์สพารามิเตอร์ 9B รองรับทุกโหมด ทางเลือกแทน GPT-4o บนอุปกรณ์ปลายทาง

MiniCPM-o 4.5: โมเดลโอเพ่นซอร์สออลโมดัลขนาด 9B พารามิเตอร์ ทางเลือกแทน GPT-4o บนอุปกรณ์ปลายทาง MiniCPM-o 4.5 เป็นโมเดลเรือธงออลโมดัลรุ่นใหม่ที่เปิดตัวโดย OpenBMB ของ Mianbi AI โดยม…

2026年2月13日

208000

ข่าวสารอุตสาหกรรม AI

Meituan STAR โมเดลขนาดใหญ่: ฝ่าด่านภาวะศูนย์รวม ‘ความเข้าใจ-การสร้าง’ แบบหลายรูปแบบ คะแนน GenEval สูงกว่า 0.91

เมื่อเร็วๆ นี้ Meituan ได้เปิดตัวโซลูชันโมเดลใหญ่แบบหลายรูปแบบแบบรวมศูนย์ใหม่ STAR (STacked AutoRegressive Scheme for Unified Multimodal Learning) ด้วยการออกแบบหลักสองประการที่เป็น…

2026年2月4日

183000

ข่าวสารอุตสาหกรรม AI

MiniCPM-o 4.5 จาก Mianbi Open Source: โมเดลขนาดใหญ่แบบ Full-Duplex และ Full-Modal พร้อมพารามิเตอร์ 9B ที่สร้างประสบการณ์การโต้ตอบ “เหมือนมนุษย์จริง” เปิดยุคใหม่ของการสนทนาระหว่างมนุษย์และเครื่องจักร

คุณเคยคิดถึงปัญหานี้ไหม: ทำไมเวลาคุยกับ AI ถึงรู้สึกขาด ‘ความเป็นมนุษย์’ ไปนิด? ไม่ใช่เพราะมันตอบไม่ถูกต้อง หรือไม่เข้าใจสิ่งที่คุณพูด แต่เพราะทุกการโต้ตอบดูแข็งทื่อเกิ…

2026年2月4日

210000