วิศวกรรมโมเดลขนาดใหญ่

MoGraphGPT: สร้างฉากปฏิสัมพันธ์ซับซ้อนโดยไม่ต้องเขียนโค้ด ภาษาธรรมชาติ + การขีดเขียนช่วยให้ความคิดสร้างสรรค์เป็นภาพ

ต้องการสร้างเกมเว็บขนาดเล็ก แอนิเมชันแบบโต้ตอบ หรือการสาธิตการสอนอย่างรวดเร็ว แต่ติดขัดกับตรรกะโค้ดที่ซับซ้อนและการดีบั๊กการโต้ตอบขององค์ประกอบหลายอย่าง? แม้ว่าโมเดลภาษาขนาดใหญ่หรื…

2026年3月21日

163000

วิศวกรรมโมเดลขนาดใหญ่

เคล็ดลับการพัฒนา Skills ภายใน Anthropic: จากประสบการณ์จริงสู่แนวทางปฏิบัติที่ดีที่สุด

Skills ได้กลายเป็นหนึ่งในวิธีการขยายความสามารถที่ใช้กันอย่างแพร่หลายที่สุดใน Claude Code พวกมันมีความยืดหยุ่น สร้างง่าย และแจกจ่ายได้สะดวก แต่ความยืดหยุ่นนี้ก็มาพร้อมกับปัญหา: มันย…

2026年3月21日

184000

วิศวกรรมโมเดลขนาดใหญ่

เปิดเผยการเพิ่มประสิทธิภาพคอมไพเลอร์ MLIR: วิธีที่ Double Buffering และ Multithreading ช่วยซ่อนความล่าช้าและเร่งความเร็วแบบขนานในเคอร์เนล AI

คำสำคัญ: MLIR, คอมไพเลอร์เคอร์เนล AI, การซ่อนความหน่วง, ความขนาน, บัฟเฟอร์คู่ Analyzing Latency Hiding and Parallelism in an MLIR-based AI Kernel Compiler https://arxiv.org/pdf/260…

2026年3月21日

185001

วิศวกรรมโมเดลขนาดใหญ่

ทีม MiMo ของ Xiaomi เผยเคล็ดลับ: ระบบปักกิ่งสร้างโมเดลระดับโลกชั้นนำอย่างไร?

ทีม MiMo ของ Xiaomi เผยเบื้องหลัง: กลุ่มศิษย์เก่ามหาวิทยาลัยปักกิ่งสร้างโมเดลใหญ่ระดับโลกชั้นนำได้อย่างไร? ในทีม MiMo ของ Xiaomi ผู้ที่มียอดการสนทนา Agent น้อยกว่า 100 ครั้งต่อวัน …

2026年3月20日

172000

วิศวกรรมโมเดลขนาดใหญ่

ก้าวข้ามข้อจำกัดด้านความจำ! สถาปัตยกรรม MSA บรรลุความจำระยะยาว 100M Token เปิดศักราชใหม่แห่งความจำตลอดชีวิตสำหรับโมเดลขนาดใหญ่

ปัญญาของมนุษย์ประกอบด้วยความสามารถในการให้เหตุผลและความสามารถในการจำระยะยาว ในช่วงไม่กี่ปีที่ผ่านมา ความสามารถในการให้เหตุผลของโมเดลขนาดใหญ่พัฒนาอย่างรวดเร็ว แต่ความสามารถในการจำระ…

2026年3月19日

187000

วิศวกรรมโมเดลขนาดใหญ่

Streamo: ทำให้โมเดลวิดีโอขนาดใหญ่เรียนรู้ “เมื่อใดควรพูด” ปฏิสัมพันธ์สตรีมมิ่งเรียลไทม์ไม่สะดุดอีกต่อไป

ในขณะที่โมเดลวิดีโอขนาดใหญ่ทำคะแนนสูงขึ้นเรื่อยๆ บนเกณฑ์มาตรฐานออฟไลน์อย่าง MVBench และ VideoMME การประยุกต์ใช้ในสถานการณ์การโต้ตอบจริงกลับเผชิญกับความท้าทายหลักสองประการ: จะจัดการ…

2026年3月19日

154000

วิศวกรรมโมเดลขนาดใหญ่

Kimi เปิดตัว ‘Attention Residuals’ อย่างยิ่งใหญ่: ทำลายกรอบการเชื่อมต่อแบบ Residual ที่มีมานานทศวรรษ บรรลุประสิทธิภาพเพิ่มขึ้น 1.25 เท่าด้วยกำลังประมวลผลเท่าเดิม

Attention Residuals: การปรับปรุงโครงสร้างของ Residual Connections บทนำ: ปัญหาพื้นฐาน โมเดลภาษาขนาดใหญ่สมัยใหม่ส่วนใหญ่ใช้สถาปัตยกรรมเครือข่ายประสาทเทียมแบบลึก ข้อมูลจะถูกส่งผ่านจาก…

2026年3月18日

172000

วิศวกรรมโมเดลขนาดใหญ่

MiniMax M2.7 เปิดตัวครั้งใหญ่: AI Agent อเนกประสงค์ รับมือทุกงานซับซ้อน ทีมเวิร์ก และแก้ไขโค้ดได้ครบจบในที่เดียว

MiniMax M2.7 เปิดตัวครั้งใหญ่: AI Agent อเนกประสงค์ จัดการงานซับซ้อน การทำงานเป็นทีม และแก้ไขข้อบกพร่องโค้ดได้ครบครัน หลังจากเปิดตัวโมเดล M2.5 เพียงหนึ่งเดือน MiniMax ก็ได้เปิดตัวโ…

2026年3月18日

205000

วิศวกรรมโมเดลขนาดใหญ่

คุณภาพเอกสารเครื่องมือเป็นคอขวดของ AI Agent? การวิจัยใหม่ ICLR 2026: การขยายเอกสารอย่างง่ายสามารถปรับปรุงประสิทธิภาพการค้นหาเครื่องมือได้อย่างมีนัยสำคัญ

ในยุคของโมเดลขนาดใหญ่ การเรียกใช้เครื่องมือ (Tool-Use) ได้กลายเป็นแกนกลางของความสามารถของเอเจนต์อัจฉริยะ ตั้งแต่การสร้างโค้ดไปจนถึงการเรียกใช้ API ที่ซับซ้อน โมเดลภาษาขนาดใหญ่กำลัง…

2026年3月18日

194000

วิศวกรรมโมเดลขนาดใหญ่

CVPR2026 งานวิจัยที่ได้คะแนนเต็ม: Proxy-GS เร่งความเร็วการเรนเดอร์ 3D Gaussian Splatting 2.5 เท่า โดยใช้โครงตาข่ายพร็อกซีน้ำหนักเบาเพื่อรวมข้อมูลการบังล่วงหน้า

ในฉากทิวทัศน์เมือง Proxy-GS บรรลุการเรนเดอร์เรียลไทม์ที่เสถียรในขณะที่ยังคงรายละเอียดภาพระดับละเอียดไว้ วิธีการนี้ลดจำนวนจุดยึด (anchor) ที่ต้องถอดรหัสได้อย่างมีนัยสำคัญ ส่งผลให้ปร…

2026年3月18日

163000