สถาปัตยกรรมโมเดลขนาดใหญ่
-
GLM-5 เปิดตัวอย่างยิ่งใหญ่: มอนสเตอร์โอเพ่นซอร์ส 744B พารามิเตอร์ ตั้งมาตรฐานใหม่ให้กับเอเจนต์อัจฉริยะระยะยาวและวิศวกรรมระบบที่ซับซ้อน
GLM-5 ได้รับการเปิดตัวอย่างเป็นทางการ โดยมีเป้าหมายตรงไปที่ Claude โดยมุ่งเน้นไปที่การแก้ไขงานวิศวกรรมระบบที่ซับซ้อนและงานเอเจนต์ระยะยาว ขนาดพารามิเตอร์ของโมเดลเพิ่มขึ้นอย่างมากจาก…
-
DeepSeek V4 สถาปัตยกรรมปฏิวัติ: นวัตกรรมคู่แกน mHC และ Engram พลิกโฉมรูปแบบการทำงานด้านการเขียนโปรแกรมแบบดั้งเดิม
2026 ปีใหม่จีนใกล้เข้ามา วงการ AI ทั่วโลกก็มีข่าวลือสำคัญเช่นกัน — ห้องปฏิบัติการ AI ของจีน DeepSeek คาดว่าจะเปิดตัวโมเดลใหญ่เรือธงรุ่นที่สี่ DeepSeek V4 อย่างเป็นทางการในช่วงวันหย…