การประเมินโมเดลขนาดใหญ่
-
Claude Opus 4.6 เปิดตัวอย่างยิ่งใหญ่: คะแนน ARC-AGI 68% ทำลายสถิติ หน้าต่างบริบทล้านโทเค็นเปิดยุคใหม่แห่ง AI
Anthropic ได้เปิดตัวรุ่นล่าสุดของโมเดลแฟลกชิป Claude Opus เวอร์ชัน 4.6 อย่างเป็นทางการ การอัปเกรดครั้งนี้มาพร้อมกับการเพิ่มขึ้นของความฉลาดอย่างมีนัยสำคัญ โดยเฉพาะอย่างยิ่งในแบบทดสอ…
-
Step-3.5-Flash แห่ง Step-Scale Stars: การอนุมานความเร็วสูง 300 tps, คำตอบใหม่สำหรับยุคเอเจนต์
ข้อสรุปหลัก: ความเร็วคือความสามารถในการแข่งขันที่สำคัญในยุคเอเจนต์ ภูมิหลังของโมเดล: หลังจากที่ StepFun (阶跃星辰) เข้าร่วมการประเมินโมเดลภาษาขนาดใหญ่ในประเทศเมื่อเดือนกรกฎาคมปีที่แล้ว…