วิศวกรรมโมเดลขนาดใหญ่
-
HISA: กลไกความสนใจแบบเบาบางใหม่ทำลายข้อจำกัดบริบท 64K เร่งความเร็ว 2-4 เท่า พร้อมใช้งานทันทีโดยไม่ต้องฝึกใหม่
HISA: กลไกความสนใจแบบเบาบางใหม่ทำลายข้อจำกัดบริบท 64K เร่งความเร็ว 2-4 เท่า ใช้งานได้ทันทีโดยไม่ต้องฝึกใหม่ งานวิจัยใหม่เสนอกลไกความสนใจแบบเบาบางชื่อ HISA (Hierarchical Indexed Spa…
-
Karpathy สร้าง LLM Wiki โด่งดัง: ในยุค Agent แค่แชร์ไอเดีย AI ก็สร้างคลังความรู้ส่วนตัวได้อัตโนมัติ
เมื่อเร็วๆ นี้ โครงการ “LLM Wiki” ซึ่งเป็นคลังความรู้ส่วนบุคคลที่สร้างขึ้นโดย Andrej Karpathy นักวิชาการชื่อดังในสาขาปัญญาประดิษฐ์ ได้ดึงดูดความสนใจอย่างกว้างขวางในชุมช…
-
Meta-Harness: นำการปรับปรุงชุดเครื่องมือ LLM เข้าสู่ยุค “ขับเคลื่อนอัตโนมัติ” เพิ่มประสิทธิภาพสูงสุดถึง 6 เท่า
คีย์เวิร์ด: Meta-Harness, การปรับปรุงชุดเครื่องมือ, การค้นหาพื้นที่โค้ด, การเข้าถึงเส้นทางการทำงาน, การปรับปรุงแบบเอเจนต์ การเปลี่ยนแปลงชุดเครื่องมือรอบนอกของโมเดลภาษาขนาดใหญ่ที่ถู…
-
Alibaba Qwen3.6-Plus เปิดตัวแบบเซอร์ไพรส์: ความสามารถด้านการเขียนโปรแกรมทะลุเพดานของจีน ไล่ตาม Claude Opus อย่างใกล้ชิด
อาลีหยุนเปิดตัว Qwen3.6-Plus อย่างไม่ทันตั้งตัว: ความสามารถด้านการเขียนโปรแกรมทะลุเพดานของจีน ไล่ตาม Claude Opus อย่างจี้ติด อาลีหยุนเพิ่งเปิดตัวโมเดลพื้นฐานขนาดใหญ่รุ่นใหม่ Qwen3.…
-
GLM-5.1-Turbo การทดสอบจริง: โมเดลอันดับหนึ่งโอเพ่นซอร์สพัฒนาแอปพลิเคชันสมบูรณ์ใน 1 ชั่วโมงและประมวลผลข้อมูล 100,000 รายการได้อย่างไร
หลังจาก GLM-5.1-Turbo เปิดตัวไม่นาน บริการ Coding Plan ของ Zhipu ก็ประกาศรองรับโมเดลนี้ ฉันจึงเปลี่ยนไปใช้โมเดล GLM-5.1 ใน Claude Code ทันทีเพื่อทดลองใช้งานเชิงลึก หลังจากการทดสอบอ…
-
การตรวจสอบด้วยการขับเคลื่อนการเล่นซ้ำ: วิธีการใหม่ในการก้าวข้ามข้อจำกัดการตรวจสอบก่อนการผลิตชิปในสถาปัตยกรรมชิปเล็ต CPU-GPU
คำสำคัญ: การตรวจสอบแบบขับเคลื่อนด้วยการเล่นซ้ำ, สถาปัตยกรรม CPU-GPU, ชิปเล็ต ODIN, เครือข่ายบนชิป, การตรวจสอบก่อนการผลิตชิป การผสานเทคโนโลยี CPU และ GPU เป็นเทคโนโลยีหลักที่รองรับง…
-
ซอร์สโค้ด Claude Code รั่วอย่างไม่คาดคิด: วงการ AI ตื่นตัว กลไกป้องกันการกลั่นกรองและดีไซน์คำสั่งระบบถูกเปิดเผย
เมื่อวานนี้ มีเหตุการณ์ที่สร้างความตื่นเต้นในวงการ AI เกิดขึ้น: ซอร์สโค้ดของ Claude Code ถูก “เปิด” แบบไม่ตั้งใจ เนื่องจากความผิดพลาดทางวิศวกรรม Anthropic ไม่ได้ลบไฟล์ …
-
โมเดลมนุษย์ดิจิทัลของ JD.com ฝ่าข้อจำกัดการโต้ตอบของเอเจนต์ AI บรรลุการสังเคราะห์อิสระในระดับนาที
ในการประชุม GTC ปี 2026 มีฉันทามติในอุตสาหกรรมเกิดขึ้นแล้วว่า AI กำลังก้าวเข้าสู่ยุคเอเจนต์ (Agent) อย่างไรก็ตาม ในขณะที่ผู้ผลิตหลายรายต่างเร่งวางแผนพัฒนาเอเจนต์ ความท้าทายในทางปฏิ…
-
เบื้องหลังความสำเร็จของ OpenClaw: เทคโนโลยีเอเจนต์เข้าสู่ “การปฏิวัติความสามารถในการใช้งาน” การบูรณาการทางวิศวกรรมกลายเป็นจุดเปลี่ยนสำคัญ
ในช่วงหลายเดือนที่ผ่านมา ชื่อหนึ่งในแวดวง AI ที่ยากจะหลีกเลี่ยงคือ OpenClaw โครงการนี้ได้รับความสนใจอย่างล้นหลามในเวลาอันสั้น: ดาว (Star) หลายแสนดวง, การใช้ Token ที่น่าตกใจ, และกา…
-
PF-LLM: แก้ปัญหาการดึงข้อมูลล่วงหน้าในฮาร์ดแวร์ด้วยโมเดลภาษาขนาดใหญ่ วิเคราะห์โค้ดแบบสถิตเพื่อเพิ่มประสิทธิภาพการเข้าถึงหน่วยความจำอย่างชาญฉลาด
คำสำคัญ: การดึงข้อมูลล่วงหน้าด้วยฮาร์ดแวร์, กำแพงหน่วยความจำ, แบบจำลองภาษาขนาดใหญ่, ไมโครสถาปัตยกรรมซีพียู, การออกแบบร่วมฮาร์ดแวร์-ซอฟต์แวร์ ในการแสวงหาประสิทธิภาพของแกนประมวลผลเดี…