วิศวกรรมโมเดลขนาดใหญ่

HISA: กลไกความสนใจแบบเบาบางใหม่ทำลายข้อจำกัดบริบท 64K เร่งความเร็ว 2-4 เท่า พร้อมใช้งานทันทีโดยไม่ต้องฝึกใหม่

HISA: กลไกความสนใจแบบเบาบางใหม่ทำลายข้อจำกัดบริบท 64K เร่งความเร็ว 2-4 เท่า ใช้งานได้ทันทีโดยไม่ต้องฝึกใหม่ งานวิจัยใหม่เสนอกลไกความสนใจแบบเบาบางชื่อ HISA (Hierarchical Indexed Spa…

5 days ago

50000

วิศวกรรมโมเดลขนาดใหญ่

Karpathy สร้าง LLM Wiki โด่งดัง: ในยุค Agent แค่แชร์ไอเดีย AI ก็สร้างคลังความรู้ส่วนตัวได้อัตโนมัติ

เมื่อเร็วๆ นี้ โครงการ “LLM Wiki” ซึ่งเป็นคลังความรู้ส่วนบุคคลที่สร้างขึ้นโดย Andrej Karpathy นักวิชาการชื่อดังในสาขาปัญญาประดิษฐ์ ได้ดึงดูดความสนใจอย่างกว้างขวางในชุมช…

2026年4月5日

85000

วิศวกรรมโมเดลขนาดใหญ่

Meta-Harness: นำการปรับปรุงชุดเครื่องมือ LLM เข้าสู่ยุค “ขับเคลื่อนอัตโนมัติ” เพิ่มประสิทธิภาพสูงสุดถึง 6 เท่า

คีย์เวิร์ด: Meta-Harness, การปรับปรุงชุดเครื่องมือ, การค้นหาพื้นที่โค้ด, การเข้าถึงเส้นทางการทำงาน, การปรับปรุงแบบเอเจนต์ การเปลี่ยนแปลงชุดเครื่องมือรอบนอกของโมเดลภาษาขนาดใหญ่ที่ถู…

2026年4月4日

58000

วิศวกรรมโมเดลขนาดใหญ่

Alibaba Qwen3.6-Plus เปิดตัวแบบเซอร์ไพรส์: ความสามารถด้านการเขียนโปรแกรมทะลุเพดานของจีน ไล่ตาม Claude Opus อย่างใกล้ชิด

อาลีหยุนเปิดตัว Qwen3.6-Plus อย่างไม่ทันตั้งตัว: ความสามารถด้านการเขียนโปรแกรมทะลุเพดานของจีน ไล่ตาม Claude Opus อย่างจี้ติด อาลีหยุนเพิ่งเปิดตัวโมเดลพื้นฐานขนาดใหญ่รุ่นใหม่ Qwen3.…

2026年4月3日

74000

วิศวกรรมโมเดลขนาดใหญ่

GLM-5.1-Turbo การทดสอบจริง: โมเดลอันดับหนึ่งโอเพ่นซอร์สพัฒนาแอปพลิเคชันสมบูรณ์ใน 1 ชั่วโมงและประมวลผลข้อมูล 100,000 รายการได้อย่างไร

หลังจาก GLM-5.1-Turbo เปิดตัวไม่นาน บริการ Coding Plan ของ Zhipu ก็ประกาศรองรับโมเดลนี้ ฉันจึงเปลี่ยนไปใช้โมเดล GLM-5.1 ใน Claude Code ทันทีเพื่อทดลองใช้งานเชิงลึก หลังจากการทดสอบอ…

2026年4月2日

123000

วิศวกรรมโมเดลขนาดใหญ่

การตรวจสอบด้วยการขับเคลื่อนการเล่นซ้ำ: วิธีการใหม่ในการก้าวข้ามข้อจำกัดการตรวจสอบก่อนการผลิตชิปในสถาปัตยกรรมชิปเล็ต CPU-GPU

คำสำคัญ: การตรวจสอบแบบขับเคลื่อนด้วยการเล่นซ้ำ, สถาปัตยกรรม CPU-GPU, ชิปเล็ต ODIN, เครือข่ายบนชิป, การตรวจสอบก่อนการผลิตชิป การผสานเทคโนโลยี CPU และ GPU เป็นเทคโนโลยีหลักที่รองรับง…

2026年4月1日

80000

วิศวกรรมโมเดลขนาดใหญ่

ซอร์สโค้ด Claude Code รั่วอย่างไม่คาดคิด: วงการ AI ตื่นตัว กลไกป้องกันการกลั่นกรองและดีไซน์คำสั่งระบบถูกเปิดเผย

เมื่อวานนี้ มีเหตุการณ์ที่สร้างความตื่นเต้นในวงการ AI เกิดขึ้น: ซอร์สโค้ดของ Claude Code ถูก “เปิด” แบบไม่ตั้งใจ เนื่องจากความผิดพลาดทางวิศวกรรม Anthropic ไม่ได้ลบไฟล์ …

2026年4月1日

88000

วิศวกรรมโมเดลขนาดใหญ่

โมเดลมนุษย์ดิจิทัลของ JD.com ฝ่าข้อจำกัดการโต้ตอบของเอเจนต์ AI บรรลุการสังเคราะห์อิสระในระดับนาที

ในการประชุม GTC ปี 2026 มีฉันทามติในอุตสาหกรรมเกิดขึ้นแล้วว่า AI กำลังก้าวเข้าสู่ยุคเอเจนต์ (Agent) อย่างไรก็ตาม ในขณะที่ผู้ผลิตหลายรายต่างเร่งวางแผนพัฒนาเอเจนต์ ความท้าทายในทางปฏิ…

2026年4月1日

81000

วิศวกรรมโมเดลขนาดใหญ่

เบื้องหลังความสำเร็จของ OpenClaw: เทคโนโลยีเอเจนต์เข้าสู่ “การปฏิวัติความสามารถในการใช้งาน” การบูรณาการทางวิศวกรรมกลายเป็นจุดเปลี่ยนสำคัญ

ในช่วงหลายเดือนที่ผ่านมา ชื่อหนึ่งในแวดวง AI ที่ยากจะหลีกเลี่ยงคือ OpenClaw โครงการนี้ได้รับความสนใจอย่างล้นหลามในเวลาอันสั้น: ดาว (Star) หลายแสนดวง, การใช้ Token ที่น่าตกใจ, และกา…

2026年3月31日

95000

วิศวกรรมโมเดลขนาดใหญ่

PF-LLM: แก้ปัญหาการดึงข้อมูลล่วงหน้าในฮาร์ดแวร์ด้วยโมเดลภาษาขนาดใหญ่ วิเคราะห์โค้ดแบบสถิตเพื่อเพิ่มประสิทธิภาพการเข้าถึงหน่วยความจำอย่างชาญฉลาด

คำสำคัญ: การดึงข้อมูลล่วงหน้าด้วยฮาร์ดแวร์, กำแพงหน่วยความจำ, แบบจำลองภาษาขนาดใหญ่, ไมโครสถาปัตยกรรมซีพียู, การออกแบบร่วมฮาร์ดแวร์-ซอฟต์แวร์ ในการแสวงหาประสิทธิภาพของแกนประมวลผลเดี…

2026年3月31日

72000