GLM-5: มาตรฐานใหม่ของ AI แบบโอเพนซอร์ส สร้างอีมูเลเตอร์ GBA ด้วยการเขียนโค้ดอัตโนมัติ 24 ชั่วโมง
เมื่อเห็นความสามารถของ GLM-5 หลังเปิดตัวอย่างเป็นทางการแล้ว ถึงได้รู้สึกว่าความร้อนแรงของโมเดลลึกลับ Pony Alpha เมื่อไม่กี่วันที่ผ่านมานั้น ยังดูอนุรักษนิยมไปหน่อย
เพราะคราวนี้ GLM-5 ดึง AI แบบโอเพนซอร์ส เข้าสู่ ยุคของงานระยะยาว ไปโดยตรง
ดูสิ GLM-5 รับบทบาทหลายอย่างพร้อมกัน ทำงานเขียนโค้ดต่อเนื่อง เกิน 24 ชั่วโมง เรียกใช้เครื่องมือกว่า 700 ครั้ง สลับคอนเท็กซ์กว่า 800 ครั้ง…
แล้วมันก็สร้าง อีมูเลเตอร์ Game Boy Advance (GBA) ขึ้นมาจากศูนย์ด้วย JavaScript!
ภาพการเรนเดอร์ภายนอกเป็นแบบนี้:

ภายในหน้าจอเป็นแบบนี้:

เอฟเฟกต์การเคลื่อนไหวเมื่อไม่มีการเรนเดอร์มีดังนี้:
ต้องรู้ไว้ว่า สำหรับ AI นี่คืองานวิศวกรรมที่หลีกเลี่ยงการลัดขั้นตอนโดยสิ้นเชิง
เพราะอีมูเลเตอร์ GBA เกี่ยวข้องกับชุดคำสั่ง CPU กว่า 500 รายการ กลไกการแบ่งหน้าเมมโมรี ระบบย่อยเสียง และงานกำหนดเวลาการเรนเดอร์กราฟิก
แม้แต่คำสั่งเดียวที่ปฏิบัติผิดพลาด หรือการเขียนไฟล์ผิดเพี้ยนไปครั้งเดียว โครงการทั้งหมดก็อาจพังทลายในอีกไม่กี่ชั่วโมงต่อมา
และ GLM-5 ยังต้องเผชิญกับสภาพที่ ไม่มีการประมวลผลแบบขนาน ไม่มีโค้ดอ้างอิงใดๆ ปิดการค้นหาทางอินเทอร์เน็ต อีกด้วย
ถึงกระนั้น จากผลลัพธ์ที่แสดงในวิดีโอ เราก็ไม่ยากที่จะพบว่า GLM-5 ทำงานได้อย่างเสถียรมาก:
- การเรียกใช้เครื่องมือเสถียร: ครั้งที่ 700 กับครั้งแรก ไม่มีความแตกต่างในด้านไวยากรณ์ รูปแบบ และความแม่นยำ
- การปฏิบัติตามคำสั่งอย่างต่อเนื่อง: แม้จะสลับคอนเท็กซ์ไป 800 ครั้ง ก็ยังคงปฏิบัติตามข้อกำหนด ข้อตกลง และขั้นตอนของ Meta-Prompt
- การตัดสินใจทำงานเสถียร: GLM-5 รู้ว่าตัวเองควรทดสอบ บันทึกข้อมูล หรือเปลี่ยนกลยุทธ์เมื่อไหร่
- คอนเท็กซ์เชื่อถือได้เพียงพอ: ทุกครั้งหลังจากล้างคอนเท็กซ์ GLM-5 สามารถกู้คืนสถานะการทำงานได้อย่างแม่นยำจากบันทึกและไฟล์
ไม่แปลกใจที่ผู้ใช้เน็ตจำนวนมากหลังจากดูแล้วร้องออกมาว่า:
มัน (GLM-5) สามารถสร้างโมเดล CAD ที่สวยงามได้!

และขณะนี้ผลการประเมิน GLM-5 ก็ออกมาแล้ว ในชาร์ตอำนาจ Artificial Analysis ไปถึงระดับ ทัดเทียมกับ Claude Opus 4.5 เลยทีเดียว

ในการทดสอบมาตรฐานหลักที่ยอมรับในอุตสาหกรรม ความสามารถในการเขียนโปรแกรม ของ GLM-5 ก็สอดคล้องกับ Claude Opus 4.5 เช่นกัน:

และใน Vending Bench 2 ซึ่งวัดความสามารถในการดำเนินงานของโมเดล GLM-5 ได้อันดับหนึ่งในหมวดโอเพนซอร์ส:

แต่ Claude Opus เป็นแบบปิดซอร์ส คูเมืองที่แข็งแกร่งกลับถูก GLM-5 โมเดลโอเพนซอร์สนี้ทำลายลงในทีเดียว ทำให้ผู้ใช้เน็ตจำนวนมากตื่นเต้น:
ขอบคุณโอเพนซอร์ส!

แล้ว GLM-5 “สถาปนิกฟูลสแตก” คนแรกของโลกโอเพนซอร์สนี้ ยังมีความสามารถอะไรอีกบ้าง?
ต่อไปนี้ มาทดสอบเชิงลึกโมเดลระดับ Opus แบบโอเพนซอร์สกันเลย~
มีคนยื่นขอขึ้น App Store แล้ว
การทดสอบของเราจะดำเนินการโดย เรียกใช้ GLM-5 API ใน Claude Code
ดังนั้น การทดสอบแรกของเราคือการสร้างเกมที่ทดสอบความสามารถในการปิดลูปตรรกะของโมเดลมากที่สุด — กำหนดให้ GLM-5 สร้าง เกมเศรษฐีเวอร์ชัน 3D ตั้งแต่ต้น:

ต่อไป มาดูผลลัพธ์กันเลย:
จะเห็นได้ว่าเมื่อเผชิญกับความต้องการที่ซับซ้อนเช่นนี้ GLM-5 ก็สามารถทำให้ฟังก์ชันทั้งหมดออกมาได้อย่างมั่นคง
หาก Prompt มีรายละเอียดมากขึ้น เราก็จะได้ “เกมเศรษฐี 3D เวอร์ชันกุ้งมังกร” ที่ OpenClaw สู้กัน:
และมีผู้ใช้ใช้ GLM-5 สร้าง “TikTok” เวอร์ชันวิชาการ ขึ้นมาแล้ว และได้ยื่นขอขึ้นแอปเปิล App Store!
แอปฯ กว่า 10 รายการกำลังจะขึ้นแล้ว (showcase.z.ai):

ทดสอบต่อ
คราวนี้ เราจะทดสอบความเข้าใจของ GLM-5 ต่อคำอธิบายกฎฟิสิกส์ที่ซับซ้อน โปรดฟัง Prompt:
สร้างทรงสิบสองหน้าด้วยกระจก แต่ละหน้าเป็นมาสก์ แสดงการออกแบบที่แตกต่างกันของปมฐานแบบหมุนเดียวกันที่อยู่ตรงกลาง (ดูเหมือนภาพตัดแปะ/ฟิลเตอร์) ใช้เอฟเฟกต์แสงเรืองบางๆ เพิ่มชั้นที่สองที่เป็นเปลือกกระจก (โปร่งใส) ขนาดใหญ่กว่าประมาณสองเท่าภายนอก และทำให้แต่ละหน้าเมื่อมองผ่าน เปลี่ยนลักษณะของกระจกชั้นในให้เป็นประเภทต่างๆ เช่น มองผ่านด้านหนึ่งของชั้นนอก เปลือกชั้นในทั้งหมดดูเหมือนกระจกสี กระจกสีประดับ หรือโครงลวด ฯลฯ เพื่อเป็นข้อมูลอ้างอิง ใช้ three.js, ……
GLM-5 ยังคงจับคีย์เวิร์ดใน Prompt ได้อย่างแม่นยำ ไฟล์ HTML ที่สร้างขึ้น เมื่อเปิดแล้ว จะมีทรงสิบสองหน้าที่แสงและเงาประสานกันลอยอยู่ในอากาศ
นอกจากนี้ รวมถึงงานประเภท ฟูลสแตก เช่น การสร้างเว็บไซต์อีคอมเมิร์ซที่สมบูรณ์และมีดีไซน์ GLM-5 ก็สามารถจัดการได้เช่นกัน
และมีคนใช้ GLM-5 สร้าง เกม “มายคราฟต์” เวอร์ชัน 3D ที่โต้ตอบได้!

โอเพนซอร์ส ชนะอีกครั้ง
การปรากฏตัวของ GLM-5 ไม่ว่าจะมองจากผลการทดสอบหรือเสียงตอบรับจากผู้ใช้เน็ต กำลังบ่งชี้สิ่งหนึ่ง:
โมเดลใหญ่โอเพนซอร์สได้ผ่านการเปลี่ยนแปลงเชิงคุณภาพจากผู้ช่วยสู่วิศวกรอิสระแล้ว
ก่อนหน้านี้ เราใช้ AI โดยเขียน Prompt หนึ่งประโยค แต่ต้องคอยดีบักงานอยู่ตลอด แต่ตอนนี้ การใช้ GLM-5 สามารถเป็นการให้เป้าหมายกับมัน แล้วไปดื่มกาแฟ บางครั้งกลับมาดูว่ามันทำงานผิดทางหรือไม่
มองในภาพกว้าง นี่อาจเป็นพายุสำหรับอุตสาหกรรม SaaS
เพราะเมื่อไม่กี่วันที่ผ่านมา เมื่อโมเดลแบบปิดซอร์สที่มีความสามารถทำงานระยะยาว เช่น Claude Opus แสดงพลังออกมา ตลาดต่างประเทศก็เกิดความตื่นตระหนกแล้ว
เช่น เมื่อนั้นผู้ให้บริการข้อมูลทางการเงิน FactSet ร่วงหนักสุดในรอบ 10% ระหว่างวัน S&P Global, Moody’s, บริษัท Nasdaq ล้วนร่วง ดัชนีหลักต่างๆ ร่วงพรวด
Fortune และ CNBC รายงานว่า หุ้นประเภทซอฟต์แวร์ SaaS ถูกเทขาย นักลงทุนกังวลว่า หาก AI สามารถสร้างระบบ CRM ขึ้นมาได้สดๆ แล้ว ใครจะไปซื้อซอฟต์แวร์รายปี
แม้ว่า Jensen Huang จะปลอบใจว่า AI จะเสริมเครื่องมือที่มีอยู่ แต่ผลการทดสอบ GLM-5 บอกเราว่า: การปรับโครงสร้างอาจกำลังเกิดขึ้นแล้ว
ที่สำคัญกว่านั้น ก่อนหน้านี้ความสามารถเช่นนี้เป็นสิทธิพิเศษของยักษ์ใหญ่แบบปิดซอร์ส ตอนนี้ GLM-5 มอบกุญแจดอกนี้ให้กับนักพัฒนาทุกคน
บางทีการที่โมเดลโอเพนซอร์สทำงานเขียนโค้ดด้วยตัวเองต่อเนื่อง 24 ชั่วโมงครั้งนี้อาจเป็นเพียงจุดเริ่มต้น อนาคตจะยาวนานขึ้น เร็วขึ้น ดีขึ้น และแข็งแกร่งขึ้น
อีกสองเรื่อง
GLM ตั้งแต่เวอร์ชัน 4.5 เริ่มทุ่มเทกับการเขียนโปรแกรม AI อย่างจริงจัง ตอนนี้แพ็คเกจ coding ของ AI ผลิตในประเทศนี้ก็ได้รับความนิยมอย่างมากทั้งในและต่างประเทศ คราวนี้ Zhipu AI จำกัดการขายตั้งแต่เริ่ม ผู้ใช้เน็ตต่างชาติอยู่ในสถานะ “ขอ”
และ ตึกของบริษัท Zhipu AI ตอนนี้ก็กลายเป็น จุดถ่ายรูป ไปแล้ว:

อีมูเลเตอร์ GBA ที่เรากล่าวถึงตอนต้น เนื่องจาก GLM-5 ทำงานต่อเนื่อง พนักงานโปรแกรมเมอร์พี่ชายกลับบ้านโดยแท็กซี่เป็นแบบนี้: ผู้โดยสาร Agent
.

ที่อยู่โปรเจกต์:
* GitHub: https://github.com/zai-org/GLM-5
* Hugging Face: https://huggingface.co/zai-org/GLM-5
* ModelScope: https://modelscope.cn/models/ZhipuAI/GLM-5
* ทดลองเล่น GameBoy Advance: https://e01.ai/gba
ติดตาม “Whale Habitat” Mini Program เพื่อรับข่าวสาร AI ล่าสุด
⚠️ หมายเหตุ: เนื้อหาได้รับการแปลโดย AI และตรวจสอบโดยมนุษย์ หากมีข้อผิดพลาดโปรดแจ้ง
本文来自网络搜集,不代表คลื่นสร้างอนาคต立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/th/archives/22957
