วิศวกรรมโมเดลขนาดใหญ่
-
เคล็ดลับเพิ่มประสิทธิภาพ Claude Code 2 เท่า: 6 เทคนิคใช้บ่อยช่วยคุณลาจากการเขียนโปรแกรมไร้ประสิทธิภาพ
เคล็ดลับเพิ่มประสิทธิภาพการทำงาน Claude Code สูงสุด 2 เท่า: 6 เทคนิคใช้บ่อย ช่วยคุณลาจากการเขียนโปรแกรมไร้ประสิทธิภาพ ใช้ Claude Code เหมือนกัน บางคนแค่ใช้เป็นเครื่องมือเทอร์มินัลช…
-
Meta ร่วมมือกับ NYU ไขปัญหาการวางแผน AI: การทำให้เส้นทางเวลาเป็นเส้นตรงช่วยให้โมเดลโลกใกล้เคียงความเป็นจริงมากขึ้น
ในประวัติศาสตร์การพัฒนาปัญญาประดิษฐ์ มีนักวิทยาศาสตร์คนหนึ่งที่เกือบจะอยู่กับยุคสมัยแห่งการเรียนรู้เชิงลึกตลอดมา นั่นคือ Yann LeCun หลายคนเริ่มรู้จักโครงข่ายประสาทเทียมครั้งแรกผ่าน…
-
เอไอเอเจนต์วิวัฒนาการด้วยตัวเองใน 7 วัน ก้าวข้ามผลงานหลายเดือนของผู้เชี่ยวชาญ: เพิ่มประสิทธิภาพการปรับแต่งเคอร์เนล GPU 10.5% เปิดตัวกระบวนทัศน์ใหม่ของการค้นหาวิวัฒนาการอัตโนมัติ
คำสำคัญ: AI Agent, อัลกอริทึมวิวัฒนาการ, การปรับปรุง GPU Kernel, FlashAttention, การคำนวณแบบเฮเทอโรจีนีอัส บน GPU Blackwell ล่าสุดของ NVIDIA, AI Agent ตัวหนึ่งใช้เวลา 7 วันในการสำร…
-
โมเดล MoE: การปฏิวัติแบบเบาบางจะก้าวข้ามคอขวดการขยายตัวของโมเดลภาษาขนาดใหญ่ได้อย่างไร?
บทนำ ในช่วงหลายปีที่ผ่านมา การขยายตัวของโมเดลภาษาแบบหนาแน่นขนาดใหญ่เป็นแรงขับเคลื่อนหลักในการพัฒนาของโมเดลภาษาขนาดใหญ่ (LLMs) ตั้งแต่โมเดลยุคแรกๆ เช่น ULMFiT (ประมาณ 30 ล้านพารามิเ…
-
การปฏิวัติความจำ AI: จาก “กระดาษเปล่า” สู่ “สมอง” โครงสร้างความจำกลายเป็นคูเมืองใหม่สำหรับการนำ AI ไปใช้จริง
บริษัทหนึ่งใช้เวลาเจ็ดสัปดาห์ในการปรับใช้ AI: สัปดาห์แรก มันสามารถตอบคำถามวิเคราะห์อุตสาหกรรมได้อย่างแม่นยำ ทีมงานต่างโห่ร้องด้วยความยินดี; เมื่อถึงสัปดาห์ที่สาม มันเริ่มส่งออกข้อส…
-
Lobster AI อัปเดตครั้งใหญ่: อัปเกรดตัวเองได้ พร้อมพัฒนาอย่างครอบคลุมทั้งปลั๊กอิน ความปลอดภัย และการโต้ตอบ
Lobster AI เผยอัปเดตเวอร์ชันใหญ่: พัฒนาอย่างก้าวกระโดดด้านปลั๊กอิน ความปลอดภัย และการโต้ตอบ Lobster AI ได้เปิดตัวเวอร์ชันใหม่ล่าสุด 2026.3.22-beta.1 โดยอัปเดตครอบคลุมหลายด้าน ทั้งส…
-
จาก Context สู่ Harness: วิวัฒนาการของวิศวกรรม AI Agent แนวทางใหม่ในการก้าวข้ามข้อจำกัดด้านเสถียรภาพในการปฏิบัติงาน
บทความนี้คัดลอกมาจากเนื้อหาจดหมายข่าวสำหรับสมาชิก PRO ของ Machine Heart หลังจาก AI Agent เข้าสู่สภาพแวดล้อมการผลิต จุดสนใจหลักของอุตสาหกรรมกำลังเปลี่ยนจากการสร้างไปสู่การปฏิบัติการ…
-
LLM ทำไมถึง ‘เงียบ’ เมื่ออยู่ต่อหน้า NPU ของ Ascend? AscendCraft สร้างสะพานด้วย DSL ทำให้อัตราความสำเร็จของเคอร์เนลการสร้างพุ่งสูงถึง 98.1%
LLM ต่อหน้า NPU ของ Ascend ทำไมถึง “พูดไม่ออก”? AscendCraft ใช้ DSL สร้างสะพานเชื่อม ทำให้อัตราความสำเร็จในการสร้างเคอร์เนลพุ่งสูงถึง 98.1% (1/4) ในวงการชิป AI การเขียน…
-
การสำรวจขอบเขตของการเรียนรู้แบบเสริมกำลังแบบไม่มีผู้ดูแล: การวิจัยของมหาวิทยาลัยชิงหวาเผยให้เห็นความรุ่งเรืองและกับดักของรางวัลภายใน
การเปลี่ยนกระบวนทัศน์ของการเรียนรู้แบบเสริมแรง: จากแบบกำกับดูแลสู่แบบไร้การกำกับดูแล การเรียนรู้แบบเสริมแรงกำลังขยายขีดความสามารถของโมเดลขนาดใหญ่อย่างต่อเนื่อง ตั้งแต่ OpenAI o3 ไป…
-
นักวิจัย MIT สร้างคอมพิวเตอร์ภายใน Transformer! LLM หมดยุคคำนวณผิดพลาด รันโปรแกรมล้านขั้นตอนในไม่กี่วินาที
การสร้างคอมพิวเตอร์ภายใน Transformer: ฝ่าขีดจำกัดการคำนวณของโมเดลขนาดใหญ่ บทนำเมื่อเร็วๆ นี้ งานวิจัยจาก Dr. Christos Tzamos แห่ง MIT และทีมของเขา ได้ดึงดูดความสนใจอย่างกว้างขวางใน…