วิศวกรรมโมเดลขนาดใหญ่
-
MoGraphGPT: สร้างฉากปฏิสัมพันธ์ซับซ้อนโดยไม่ต้องเขียนโค้ด ภาษาธรรมชาติ + การขีดเขียนช่วยให้ความคิดสร้างสรรค์เป็นภาพ
ต้องการสร้างเกมเว็บขนาดเล็ก แอนิเมชันแบบโต้ตอบ หรือการสาธิตการสอนอย่างรวดเร็ว แต่ติดขัดกับตรรกะโค้ดที่ซับซ้อนและการดีบั๊กการโต้ตอบขององค์ประกอบหลายอย่าง? แม้ว่าโมเดลภาษาขนาดใหญ่หรื…
-
เคล็ดลับการพัฒนา Skills ภายใน Anthropic: จากประสบการณ์จริงสู่แนวทางปฏิบัติที่ดีที่สุด
Skills ได้กลายเป็นหนึ่งในวิธีการขยายความสามารถที่ใช้กันอย่างแพร่หลายที่สุดใน Claude Code พวกมันมีความยืดหยุ่น สร้างง่าย และแจกจ่ายได้สะดวก แต่ความยืดหยุ่นนี้ก็มาพร้อมกับปัญหา: มันย…
-
เปิดเผยการเพิ่มประสิทธิภาพคอมไพเลอร์ MLIR: วิธีที่ Double Buffering และ Multithreading ช่วยซ่อนความล่าช้าและเร่งความเร็วแบบขนานในเคอร์เนล AI
คำสำคัญ: MLIR, คอมไพเลอร์เคอร์เนล AI, การซ่อนความหน่วง, ความขนาน, บัฟเฟอร์คู่ Analyzing Latency Hiding and Parallelism in an MLIR-based AI Kernel Compiler https://arxiv.org/pdf/260…
-
ทีม MiMo ของ Xiaomi เผยเคล็ดลับ: ระบบปักกิ่งสร้างโมเดลระดับโลกชั้นนำอย่างไร?
ทีม MiMo ของ Xiaomi เผยเบื้องหลัง: กลุ่มศิษย์เก่ามหาวิทยาลัยปักกิ่งสร้างโมเดลใหญ่ระดับโลกชั้นนำได้อย่างไร? ในทีม MiMo ของ Xiaomi ผู้ที่มียอดการสนทนา Agent น้อยกว่า 100 ครั้งต่อวัน …
-
ก้าวข้ามข้อจำกัดด้านความจำ! สถาปัตยกรรม MSA บรรลุความจำระยะยาว 100M Token เปิดศักราชใหม่แห่งความจำตลอดชีวิตสำหรับโมเดลขนาดใหญ่
ปัญญาของมนุษย์ประกอบด้วยความสามารถในการให้เหตุผลและความสามารถในการจำระยะยาว ในช่วงไม่กี่ปีที่ผ่านมา ความสามารถในการให้เหตุผลของโมเดลขนาดใหญ่พัฒนาอย่างรวดเร็ว แต่ความสามารถในการจำระ…
-
Streamo: ทำให้โมเดลวิดีโอขนาดใหญ่เรียนรู้ “เมื่อใดควรพูด” ปฏิสัมพันธ์สตรีมมิ่งเรียลไทม์ไม่สะดุดอีกต่อไป
ในขณะที่โมเดลวิดีโอขนาดใหญ่ทำคะแนนสูงขึ้นเรื่อยๆ บนเกณฑ์มาตรฐานออฟไลน์อย่าง MVBench และ VideoMME การประยุกต์ใช้ในสถานการณ์การโต้ตอบจริงกลับเผชิญกับความท้าทายหลักสองประการ: จะจัดการ…
-
Kimi เปิดตัว ‘Attention Residuals’ อย่างยิ่งใหญ่: ทำลายกรอบการเชื่อมต่อแบบ Residual ที่มีมานานทศวรรษ บรรลุประสิทธิภาพเพิ่มขึ้น 1.25 เท่าด้วยกำลังประมวลผลเท่าเดิม
Attention Residuals: การปรับปรุงโครงสร้างของ Residual Connections บทนำ: ปัญหาพื้นฐาน โมเดลภาษาขนาดใหญ่สมัยใหม่ส่วนใหญ่ใช้สถาปัตยกรรมเครือข่ายประสาทเทียมแบบลึก ข้อมูลจะถูกส่งผ่านจาก…
-
MiniMax M2.7 เปิดตัวครั้งใหญ่: AI Agent อเนกประสงค์ รับมือทุกงานซับซ้อน ทีมเวิร์ก และแก้ไขโค้ดได้ครบจบในที่เดียว
MiniMax M2.7 เปิดตัวครั้งใหญ่: AI Agent อเนกประสงค์ จัดการงานซับซ้อน การทำงานเป็นทีม และแก้ไขข้อบกพร่องโค้ดได้ครบครัน หลังจากเปิดตัวโมเดล M2.5 เพียงหนึ่งเดือน MiniMax ก็ได้เปิดตัวโ…
-
คุณภาพเอกสารเครื่องมือเป็นคอขวดของ AI Agent? การวิจัยใหม่ ICLR 2026: การขยายเอกสารอย่างง่ายสามารถปรับปรุงประสิทธิภาพการค้นหาเครื่องมือได้อย่างมีนัยสำคัญ
ในยุคของโมเดลขนาดใหญ่ การเรียกใช้เครื่องมือ (Tool-Use) ได้กลายเป็นแกนกลางของความสามารถของเอเจนต์อัจฉริยะ ตั้งแต่การสร้างโค้ดไปจนถึงการเรียกใช้ API ที่ซับซ้อน โมเดลภาษาขนาดใหญ่กำลัง…
-
CVPR2026 งานวิจัยที่ได้คะแนนเต็ม: Proxy-GS เร่งความเร็วการเรนเดอร์ 3D Gaussian Splatting 2.5 เท่า โดยใช้โครงตาข่ายพร็อกซีน้ำหนักเบาเพื่อรวมข้อมูลการบังล่วงหน้า
ในฉากทิวทัศน์เมือง Proxy-GS บรรลุการเรนเดอร์เรียลไทม์ที่เสถียรในขณะที่ยังคงรายละเอียดภาพระดับละเอียดไว้ วิธีการนี้ลดจำนวนจุดยึด (anchor) ที่ต้องถอดรหัสได้อย่างมีนัยสำคัญ ส่งผลให้ปร…