เปิดตัว GLM-5-Turbo โมเดล “ล็อบสเตอร์พิเศษ” รุ่นแรกของโลก
วันนี้ Zhipu AI ได้เปิดเผยโมเดลลึกลับที่เคยทดสอบภายในมาก่อน Pony-Alpha-2 ซึ่งตัวตนที่แท้จริงคือโมเดลเฉพาะทางรุ่นแรกของโลกที่ได้รับการปรับให้เหมาะกับสถานการณ์ “ล็อบสเตอร์” (Long Context, บริบทยาว) GLM-5-Turbo

เพื่อรองรับความต้องการในการประมวลผลข้อความยาว Zhipu ได้เปิดตัวบริการ “เซ็ตล็อบสเตอร์” ที่มาคู่กันพร้อมตัวเลือกเวอร์ชันส่วนตัวและทีม โดยเซ็ตส่วนตัวมีราคา 39 หยวน ให้โควต้าประมวลผล 40 ล้านโทเคน

โมเดลนี้มีเป้าหมายเพื่อจัดการกับขั้นตอนงานที่ซับซ้อนและยาวอย่างมีประสิทธิภาพ เช่น การสร้างไกด์ท่องเที่ยวเฉพาะทางอย่างละเอียดตั้งแต่เริ่มต้น สามารถทำได้อย่างรวดเร็ว

ในกระบวนการทำงาน งานที่ซับซ้อนหลายขั้นตอน เช่น การวิจัยเชิงลึก การค้นหาและสรุปข้อมูล การสร้างเนื้อหาเอกสารยาวหรือหน้าเว็บ GLM-5-Turbo สามารถจัดระบบและประมวลผลได้ทั้งหมด
ความสามารถนี้มาจากการที่ GLM-5-Turbo ได้รับการปรับให้เหมาะสมอย่างลึกซึ้งในด้านการเรียกใช้เครื่องมือและการทำงานร่วมกันของเอเจนต์หลายตัวในเวิร์กโฟลว์ที่ซับซ้อน ทำให้แสดงความเสถียรสูงในสถานการณ์การใช้งานสุดขีดที่มีปริมาณงานสูงและลำดับยาว ทิศทางการปรับปรุงเหล่านี้ชี้ไปที่สถานการณ์การประมวลผลบริบทยาวอย่างชัดเจน
ในชุดทดสอบบริบทยาว ZClawBench ที่จัดทำโดย Zhipu เอง (ชุดคำถามและแนวทางการทดสอบได้เปิดเผยต่อสาธารณะแล้ว) GLM-5-Turbo ได้อันดับหนึ่งในคะแนนรวมของโมเดลจีน

ปัจจุบัน โมเดลที่ออกแบบมาเพื่อจัดการงานหนักนี้ สามารถเรียกใช้ผ่านแอปพลิเคชัน AutoClaw ได้โดยไม่มีข้อจำกัด
ประสบการณ์จริงกับ GLM-5-Turbo
แล้วประสิทธิภาพจริงของโมเดล “ล็อบสเตอร์พิเศษ” รุ่นนี้เป็นอย่างไร? ต่อไปนี้คือประสบการณ์เบื้องต้นจากแอปพลิเคชัน AutoClaw เฟรมเวิร์กนี้ทำให้ขั้นตอนการตั้งค่าสภาพแวดล้อมง่ายขึ้น และสามารถเลือกเรียกใช้โมเดล GLM-5-Turbo โดยตรงได้ โดยไม่ต้องมีขั้นตอนการตั้งค่า API เพิ่มเติม
ภารกิจที่หนึ่ง: การวางแผนเนื้อหาต่อเนื่องบนโซเชียลมีเดีย
เริ่มต้นด้วยการทดสอบความสามารถในการสร้างและวางแผนข้อความยาว ภารกิจคือให้โมเดลสร้างชุดโน้ตต่อเนื่อง (ทั้งหมด 7 ตอน) บนแพลตฟอร์ม Xiaohongshu โดยมีธีม “AI ช่วยให้ฉันใช้ชีวิตแบบตลกๆ ทุกวัน” แต่ละตอนต้องประกอบด้วย หัวข้อ เนื้อหาเรื่องราว คำแนะนำสำหรับภาพประกอบ คำพูดชี้นำในส่วนความคิดเห็น และแฮชแท็ก
โมเดลส่งออกเนื้อหาครบถ้วนของโน้ตทั้งเจ็ดตอนอย่างรวดเร็ว และให้คำแนะนำเกี่ยวกับจังหวะการเผยแพร่ เนื้อหาทั้งหมดเป็นข้อความที่นำไปใช้ได้ทันที มีโครงสร้างชัดเจน ท้ายแต่ละตอนมีการตั้งข้อความ “ติดตามตอนต่อไป” เพื่อดึงดูดความสนใจ ตอนสุดท้ายยังแนะนำให้มีการโต้ตอบผ่านการโหวตเพื่อสร้างความตื่นเต้นให้กับ “ซีซั่นสอง” ที่อาจเกิดขึ้น แสดงให้เห็นถึงความตระหนักในการวางแผนเพื่อสร้างซีรีส์ IP

ในด้านสไตล์เนื้อหา โมเดลผสมผสานตรรกะของ AI กับ “อารมณ์ขันแบบเย็นชา” ได้อย่างชาญฉลาด เช่น ในตอนที่อธิบายการสร้าง “GIF เต่าวิ่ง” ตามคำแนะนำของ AI แต่กลับนำไปสู่ “ฉากตายด้านสังคม” จับความรู้สึกความแตกต่างระหว่างการวางแผนและการดำเนินการได้อย่างแม่นยำ

อีกตอนหนึ่งเกี่ยวกับการคำนวณค่าใช้จ่ายชานมไข่มุก AI แนะนำให้ “เปลี่ยนความสุขเป็นน้ำเปล่าฟรี” การล้อเลียนแบบจริงจังนี้สอดคล้องกับสไตล์การประชดตัวเองที่พบเห็นทั่วไปบนแพลตฟอร์ม

หลังจากนั้น เมื่อขอให้โมเดลแยกเนื้อหายาวนี้เป็นเอกสารอิสระตามวัน มันก็ทำภารกิจสำเร็จ

ด้วย Skills (ทักษะ) หลากหลายที่มีอยู่ภายใน AutoClaw ทำให้สามารถเรียกใช้โมเดลต่างๆ เช่น การสร้างภาพได้โดยตรง ดังนั้น จึงขอให้มันสร้างภาพประกอบสำหรับโน้ตทั้งหมด โมเดลสร้างภาพหน้าปกสำหรับบทความทั้ง 7 บทความก่อน ซึ่งภาพหน้าปกของวันที่สามมีองค์ประกอบ “สติกเกอร์เต่า” ที่กล่าวถึงในเนื้อหา

หลังจากสร้างภาพประกอบที่เหลือ โมเดลไม่ได้ส่งภาพโดยตรงในอินเทอร์เฟซแชท แต่จัดระเบียบลิงก์ภาพทั้งหมดและฝังไว้ในไฟล์ README.md เพื่อส่งมอบ

สุดท้าย ขอให้โมเดลเลียนแบบรูปแบบอินเทอร์เฟซของ Xiaohongshu และสร้างหน้า HTML พรีวิวสำหรับเนื้อหาโน้ตตอนแรก ผลลัพธ์ที่ได้เลียนแบบองค์ประกอบการออกแบบอินเทอร์เฟซของแพลตฟอร์มนั้นได้อย่างใกล้เคียง
ภารกิจที่สอง: การพัฒนาแอปพลิเคชันแบบฟูลสแตก
ต่อไป ทดสอบความสามารถในการสร้างโค้ดและระบบวิศวกรรม ภารกิจคือการออกแบบแอปพลิเคชันฟูลสแตกสำหรับบันทึกรายรับรายจ่ายส่วนบุคคลที่ใช้งานได้จริงและรันในเครื่อง ต้องรองรับการบันทึกรายจ่าย การดูรายการ การลบรายการ การแสดงรายจ่ายรวมของเดือนนี้ และสถิติแยกตามหมวดหมู่ และต้องแยกส่วน front-end กับ back-end ออกจากกัน
โมเดลเลือกสแต็กเทคโนโลยี Node.js + Express + SQLite สำหรับ back-end และ HTML/CSS/JavaScript สำหรับ front-end ก่อน แล้วสร้างเฟรมเวิร์กโค้ดอย่างรวดเร็ว

อย่างไรก็ตาม เมื่อตรวจสอบสภาพแวดล้อม พบว่าเครื่องทดสอบไม่ได้ติดตั้ง Node.js โมเดลไม่ได้หยุดชะงักเพราะเหตุนี้ แต่สำรวจสภาพแวดล้อมที่ใช้ได้อย่างแข็งขัน จากนั้นจึงเปลี่ยนไปใช้ Python (เฟรมเวิร์ก Flask) เขียนส่วน back-end ใหม่

หลังจากเขียนโค้ดเสร็จ โมเดลทดสอบและตรวจสอบ API ของ back-end โดยอัตโนมัติ

มันยังจำได้ว่าต้องล้างโค้ดเวอร์ชัน Node.js ที่สร้างไว้ก่อนหน้า และเขียนสคริปต์เริ่มต้นที่สะดวกเพิ่มเติม

หลังจากเริ่มต้นแอปพลิเคชันแล้ว สามารถเปิดอินเทอร์เฟซสมุดบัญชีในเบราว์เซอร์ได้

หลังจากป้อนข้อมูลทดสอบและรีเฟรชหน้า ข้อมูลจะแสดงอย่างถาวร

บันทึกที่เพิ่มในคอมพิวเตอร์ เมื่อเข้าถึงบริการในเครื่องเดียวกันผ่านมือถือและรีเฟรชแล้ว ก็จะแสดงผลแบบซิงค์ได้เช่นกัน

ในบันทึกของเซิร์ฟเวอร์ back-end ก็บันทึกการดำเนินการเพิ่มข้อมูลอย่างชัดเจน ยืนยันว่าฟลว์ข้อมูลของแอปพลิเคชันทั้งหมด (front-end, back-end, ฐานข้อมูล) ทำงานได้อย่างสมบูรณ์ ไม่ใช่การจำลองแบบคงที่

ภารกิจที่สาม: การดำเนินการไฟล์ในเครื่องและการวิเคราะห์ข้อมูล
สุดท้าย ทดสอบความสามารถในการดำเนินการไฟล์ที่ซับซ้อนและการวิเคราะห์ข้อมูลในสภาพแวดล้อมท้องถิ่น โดยสมมติบทบาทเป็นผู้ดำเนินการอีคอมเมิร์ซ ให้ไฟล์ข้อมูลการขาย (ประกอบด้วยรูปแบบ JSON, ตาราง, ข้อความ ฯลฯ) ที่มีรูปแบบวุ่นวายจากแพลตฟอร์มสมมติสามแห่ง (SkyTrade, GlobalHub, OceanMall) และขอให้โมเดลทำความสะอาดข้อมูล สรุปข้อมูล และระบุปัญหาที่เฉพาะเจาะจง
คำสั่งภารกิจคือ: เข้าควบคุมไฟล์ข้อมูลดิบทั้งหมดในโฟลเดอร์ที่กำหนด ดำเนินการจัดตำแหน่งและทำความสะอาดข้อมูลข้ามแพลตฟอร์มโดยอัตโนมัติ คำนวณกำไรสุทธิของเดือนนี้โดยผสมผสานกับการกำหนดค่าต้นทุน ระบุสินค้า 3 รายการที่เป็น “หลุมดำการคืนสินค้า” และสร้างโปรไฟล์ลูกค้า 5 รายที่ให้ผลงานมากที่สุด (ต้องรวม ID ชื่อเดียวกันข้ามแพลตฟอร์ม) สุดท้ายส่งมอบรายงานการวิเคราะห์ Markdown และตารางสรุปทางการเงิน
โมเดลเขียนสคริปต์ Python ที่ทำความสะอาด จัดตำแหน่ง และวิเคราะห์ข้อมูลที่วุ่นวายในครั้งเดียว

หลังจากโปรแกรมทำงาน ไม่เพียงแต่สร้างไฟล์ตารางที่ต้องการ แต่ยังรายงานผลการจัดระเบียบที่สำคัญโดยตรงในอินเทอร์เฟซการสนทนา

สำหรับผลการวิเคราะห์สินค้า “หลุมดำการคืนสินค้า” และลูกค้า “เจ้าสัวระดับท็อป” ก็ให้คำตอบที่เฉพาะเจาะจงในการสนทนา

ปรับให้เหมาะกับงานบริบทยาวโดยเฉพาะ
เหตุผลที่ GLM-5-Turbo ถูกเรียกว่าโมเดล “ล็อบสเตอร์พิเศษ” อยู่ที่การปรับให้เหมาะสมอย่างลึกซึ้งในด้านความสามารถในการเรียกใช้เครื่องมือและการทำงานร่วมกันของเอเจนต์หลายตัว
ประสบการณ์จริงแสดงให้เห็นว่า โมเดลนี้ไม่เพียงแต่เข้าใจและดำเนินการคำสั่งลำดับยาวได้แม่นยำมากขึ้นเท่านั้น แต่เมื่อจัดการกับงานที่ซับซ้อนที่มีหลายขั้นตอนและเส้นทางยาว ก็ยังแสดงความเป็นระเบียบและความต่อเนื่องที่ดี มันสามารถวางแผนขั้นตอนงาน เรียกใช้เครื่องมือภายนอกหรือ Skills ที่มีอยู่ภายในได้อย่างแม่นยำ และประสานงาน “เอเจนต์” หลายตัวให้ทำงานแบ่งหน้าที่กัน โดยแต่ละขั้นตอนเชื่อมต่อกันอย่างราบรื่นและมีความเสถียรค่อนข้างสูง
นอกจากนี้ ความเข้าใจของโมเดลต่อมิติเวลาของงานก็ได้รับการเสริมความแข็งแกร่ง ไม่ว่าจะเป็นงานที่กำหนดเวลา หรืองานวิศวกรรมที่ซับซ้อนที่ต้องรันต่อเนื่องเป็นเวลานาน มันก็สามารถรักษาการดำเนินการที่เสถียรได้ ไม่ง่ายที่จะหยุดชะงัก
ในด้านการเขียนโปรแกรม ความสามารถของโมเดลได้พัฒนาจาก “การเขียนโปรแกรมแบบรู้สึก (Vibe Coding)” ที่อาศัยสัญชาตญาณ ไปสู่ระดับวิศวกรรมเอเจนต์ (Agentic Engineering) ที่แท้จริง
ในสถานการณ์ที่แทบไม่ต้องการการแทรกแซงจากมนุษย์ โมเดลสามารถวางแผนงานระยะยาวและส่งมอบระบบสุดท้ายได้โดยอัตโนมัติ ซึ่งหมายความว่า แม้แต่ผู้พัฒนารายบุคคลก็สามารถบรรลุผลลัพธ์ที่ซับซ้อนซึ่งในอดีตต้องอาศัยการทำงานร่วมกันของทีมขนาดใหญ่
เพื่อให้ความสามารถเหล่านี้นำไปประยุกต์ใช้ได้ง่ายขึ้น Zhipu ได้เปิดตัว “เซ็ตล็อบสเตอร์” (Claw-plan) สำหรับองค์กรบนพื้นฐานของ Coding Plan เดิม ในโหมดนี้ ตรรกะการชำระเงินขององค์กรเปลี่ยนจากการ “ซื้อทรัพยากรการคำนวณ” (โทเคน) ธรรมดา ไปเป็นการ “จ้างพนักงานดิจิทัลหนึ่งคน”
ปัจจุบัน เซ็ตองค์กรนี้ได้เปิดตัวอย่างเป็นทางการแล้ว ผู้พัฒนาและผู้ใช้องค์กรสามารถเรียกใช้ API ที่เกี่ยวข้องผ่านแพลตฟอร์มเปิดของ Zhipu หรือเชื่อมต่อกับบริการ “เซ็ตล็อบสเตอร์” โดยตรง
นอกจากนี้ ใน GLM Coding Plan เวอร์ชัน Max ได้รวมโมเดล GLM-5-Turbo แล้ว คาดว่า Pro package จะรองรับภายในเดือนนี้ และ Lite package มีแผนจะรองรับภายในเดือนเมษายน
สำหรับผู้ใช้ที่กำลังมองหาวิธีแก้ไขสำหรับสถานการณ์การใช้งานแอปพลิเคชันเอเจนต์ที่ซับซ้อน นี่เป็นตัวเลือกที่มีความคุ้มค่าคุ้มราคา

⚠️ หมายเหตุ: เนื้อหาได้รับการแปลโดย AI และตรวจสอบโดยมนุษย์ หากมีข้อผิดพลาดโปรดแจ้ง
本文来自网络搜集,不代表คลื่นสร้างอนาคต立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/th/archives/25986
