การทดสอบมาตรฐาน
-
KernelArena: แพลตฟอร์มประเมินประสิทธิภาพ GPU Kernel แห่งแรกที่สร้างโดย AI ปิดฉากยุค “เลือกโมเดลตามความรู้สึก”
KernelArena: แพลตฟอร์มประเมินประสิทธิภาพเคอร์เนล GPU ที่สร้างโดย AI แห่งแรก ยุติยุค “เลือกโมเดลตามความรู้สึก” ขีดความสามารถของโมเดลภาษาขนาดใหญ่ล้ำสมัยกำลังถูกขยายออกไปอ…
-
NVIDIA DreamZero ขึ้นอันดับหนึ่งในการทดสอบมาตรฐานหุ่นยนต์: โมเดลโลก-แอ็กชันทำลายขีดจำกัดประสิทธิภาพได้อย่างไร?
เมื่อเร็วๆ นี้ โมเดลโลก-แอคชัน DreamZero ที่ NVIDIA เปิดตัว ได้ทำคะแนนนำในการทดสอบมาตรฐานหุ่นยนต์สองรายการคือ RoboArena และ MolmoSpaces แนวคิดการออกแบบหลักของ DreamZero คือ: ภายในโ…
-
Gemini 3.1 Pro เปิดตัวอย่างยิ่งใหญ่: ความสามารถในการให้เหตุผลเพิ่มขึ้นสองเท่า ประสิทธิภาพต้นทุนก้าวข้ามสองด้าน การแข่งขัน AI เข้าสู่ระยะใหม่
วันนี้ Google เปิดตัว Gemini 3.1 Pro อย่างเป็นทางการ ในแบบทดสอบมาตรฐาน ARC-AGI-2 ซึ่งประเมินความสามารถของโมเดลในการแก้ไขรูปแบบตรรกะใหม่ คะแนนของมันสูงถึง 77.1% ซึ่งเพิ่มขึ้นมากกว่า…