MiniMax M2.5 ระเบิดความต้องการ AI: ปริมาณการใช้งานรายสัปดาห์ทะลุ 3T โอเพนซอร์ส Agent Eco Full Access

เทศกาลตรุษจีนนี้ MiniMax โด่งดังสุดขีด

วันที่ 20 กุมภาพันธ์ วันแรกของการซื้อขายในตลาดหุ้นฮ่องกงในปีม้า หุ้น MiniMax ปิดตลาดที่เพิ่มขึ้น 14.52% มูลค่าตลาดทะลุ 3.042 แสนล้านดอลลาร์ฮ่องกง

MiniMax M2.5 ระเบิดความต้องการ AI: ปริมาณการใช้งานรายสัปดาห์ทะลุ 3T โอเพนซอร์ส Agent Eco Full Access

การขึ้นราคารอบนี้ไม่ใช่เพียงการระบายอารมณ์ของตลาดทุน

ในช่วงสองปีที่ผ่านมา การเล่าเรื่องในอุตสาหกรรม AI เกือบทั้งหมดมุ่งเน้นไปที่ด้านอุปทาน เช่น โมเดลที่แข็งแกร่งขึ้น ชิปที่เร็วขึ้น และศูนย์ข้อมูลที่ใหญ่ขึ้น อย่างไรก็ตาม สิ่งที่จำกัดการนำ AI ไปใช้ในระดับอุตสาหกรรม นอกจากขีดจำกัดความสามารถด้านอุปทานแล้ว ยังมีอุปสงค์จำนวนมากที่ถูกกดเก็บไว้เป็นเวลานานและยังไม่ได้รับการปลดปล่อยอย่างแท้จริง

ช่วงก่อนและหลังวันหยุดตรุษจีน MiniMax เปิดตัวโมเดลรุ่นใหม่ M2.5 อุปสงค์ที่ถูกกดดันเหล่านี้จึงได้พบทางออก

ภายใน 12 ชั่วโมงหลังเปิดตัว M2.5 ติดอันดับ 1 บน OpenRouter Heat Chart ภายในหนึ่งสัปดาห์ติดอันดับ 1 ในแง่ของปริมาณการเรียกใช้ ปริมาณการเรียกใช้รายสัปดาห์พุ่งสูงถึง 3.07T tokens เกินกว่าผลรวมของ Kimi K2.5, GLM-5 และ DeepSeek V3.2

MiniMax M2.5 ระเบิดความต้องการ AI: ปริมาณการใช้งานรายสัปดาห์ทะลุ 3T โอเพนซอร์ส Agent Eco Full Access

นี่ยังไม่ใช่ทั้งหมดของเรื่อง ปริมาณการเรียกใช้โดยรวมของ OpenRouter ก็เพิ่มขึ้นพร้อมกันเช่นกัน ทางการยืนยันในภายหลังว่า M2.5 ส่งผลให้เกิดความต้องการเรียกใช้เพิ่มเติมในช่วงข้อความยาว 100K ถึง 1M tokens ซึ่งเป็นช่วงที่ใช้ในสถานการณ์ทั่วไปของ Agent workflow

ก่อนหน้านี้ เนื่องจากไม่สามารถหาโมเดลที่มีทั้งความสามารถและต้นทุนที่ผ่านเกณฑ์ได้ นักพัฒนาจำนวนมากที่มี workflow พร้อมใช้งานจึงไม่สามารถเริ่มต้นได้ งานของ Agent ใช้ tokens หนาแน่นกว่าการสนทนาทั่วไปมาก เมื่อความต้องการถูกกระตุ้น ปริมาณการเรียกใช้ที่เพิ่มขึ้นตามมาจึงค่อนข้างน่าจับตา

MiniMax M2.5 ระเบิดความต้องการ AI: ปริมาณการใช้งานรายสัปดาห์ทะลุ 3T โอเพนซอร์ส Agent Eco Full Access

สิ่งที่ซิลิคอนวัลเลย์ใช้ กำลังเปลี่ยนแปลงอย่างเงียบๆ

ตั้งแต่ MiniMax เปิดตัวโมเดล M2.1 Kilo Code ผู้ท้าชิงที่แข็งแกร่งที่สุดของ Cursor ที่ได้รับการยอมรับในซิลิคอนวัลเลย์ได้แสดงจุดยืนแล้ว เครื่องมือเขียนโปรแกรม AI ที่สามารถเรียกใช้โมเดลได้มากกว่า 500 รุ่นทั่วโลก เคยประกาศอย่างชัดเจนว่าเลือก MiniMax M2.1 เป็นโมเดลเริ่มต้นในตำแหน่งโมเดลหลักของผลิตภัณฑ์

Breitenother ผู้ร่วมก่อตั้งและ CEO ของ Kilo ให้เหตุผลง่ายๆ ว่า ในการทำงานเขียนโค้ดจริงที่นักพัฒนาตัดสินโดยตรง M2.1 สามารถเทียบเคียงกับโมเดลระดับแนวหน้าได้

หลังจากเปิดตัว M2.5 ครั้งนี้ ก็เปิดตัวแบบโอเพนซอร์สเต็มรูปแบบ น้ำหนักโมเดลเผยแพร่บน HuggingFace รองรับการติดตั้งในท้องถิ่น Kilo ประกาศเชื่อมต่ออีกครั้ง ในเวลาเดียวกัน OpenCode, OpenClaw, Fireworks, Factory, TRAE, Cline, OpenHands, Roo Code รวมถึง Ollama, vLLM, SGLang, Dify, ชุมชนโมด้า และแพลตฟอร์มเครื่องมือโอเพนซอร์สที่มีชื่อเสียงทั้งในและต่างประเทศ ก็เชื่อมต่อทันทีเช่นกัน

MiniMax M2.5 ระเบิดความต้องการ AI: ปริมาณการใช้งานรายสัปดาห์ทะลุ 3T โอเพนซอร์ส Agent Eco Full Access

Kilo เป็นตัวแทนของทิศทางใหม่ของเครื่องมือเขียนโปรแกรม AI OpenClaw เป็นตัวแทนของ AgentOS ล่าสุด พวกเขามีความเลือกมากในการเลือกโมเดลพื้นฐาน การที่ M2.5 สามารถกลายเป็นตัวเลือกแนะนำอันดับแรกสำหรับผลิตภัณฑ์ประเภทนี้ หมายถึงการยอมรับโมเดลในสภาพแวดล้อมการผลิตจริง

ในการประเมิน SWE-Bench Verified ที่เป็นตัวแทนที่สุดในด้านการเขียนโปรแกรม M2.5 บรรลุระดับเทียบเท่ากับซีรีส์ Claude Opus ด้วยอัตราการผ่าน 80.2% และอยู่อันดับ 1 ในงานหลายภาษา Multi-SWE-Bench

บล็อกเกอร์ด้านเทคนิคชื่อดัง Simon Willison ใช้ mini-swe-agent เพื่อประเมินโมเดลหลักในปัจจุบันอย่างอิสระ ผลลัพธ์แสดงว่า M2.5 อยู่อันดับ 3 รองจาก Claude Opus 4.5 และ Gemini 3 Flash และเป็นอันดับ 1 ในโมเดลโอเพนซอร์ส

MiniMax M2.5 ระเบิดความต้องการ AI: ปริมาณการใช้งานรายสัปดาห์ทะลุ 3T โอเพนซอร์ส Agent Eco Full Access
MiniMax M2.5 ระเบิดความต้องการ AI: ปริมาณการใช้งานรายสัปดาห์ทะลุ 3T โอเพนซอร์ส Agent Eco Full Access

ประสิทธิภาพการทำงานก็เพิ่มขึ้นอย่างมีนัยสำคัญเช่นกัน การทดสอบจริงโดยสถาบันวิจัย SemiAnalysis แสดงว่า บนการ์ดแสดงผล H200 8 ใบ M2.5 สามารถรักษาปริมาณงานได้ประมาณ 2500 tokens ต่อ GPU ต่อวินาที ภายใต้ช่วงเวลาแฝงของโทเค็นแรกที่สมเหตุสมผล แม้ภายใต้เงื่อนไขที่ต้องการการโต้ตอบ 20 tokens ต่อผู้ใช้ต่อวินาทีอย่างเข้มงวด เมื่อประมวลผลคอนเท็กซ์ที่มีมากกว่า 10,000 tokens ยังคงรักษาความเร็วในการถอดรหัสที่เสถียรได้

MiniMax M2.5 ระเบิดความต้องการ AI: ปริมาณการใช้งานรายสัปดาห์ทะลุ 3T โอเพนซอร์ส Agent Eco Full Access

การเชื่อมต่ออย่างหนาแน่นของชุมชน Agent โอเพนซอร์สก็บ่งบอกปัญหาเช่นกัน สำหรับ Agent framework ที่ต้องทำงานเป็นเวลานานและเรียกใช้เครื่องมือบ่อยครั้ง การกำหนดราคาของโมเดลเป็นตัวกำหนดโดยตรงว่าผลิตภัณฑ์จะสามารถดำเนินธุรกิจได้หรือไม่

ช่วงราคาของ M2.5 อยู่ในขอบเขตที่ผลิตภัณฑ์เหล่านี้ยอมรับได้จริง มันมีสองเวอร์ชัน: เวอร์ชันเร็ว 100 TPS ใส่ข้อมูลเพียง 0.3 ดอลลาร์ต่อล้าน tokens เอาต์พุตเพียง 2.4 ดอลลาร์ต่อล้าน tokens; เวอร์ชัน 50 TPS ราคาเอาต์พุตลดลงอีกครึ่งหนึ่ง

ความสามารถ ความเร็ว ต้นทุน สามมิตินี้บรรลุพร้อมกันใน M2.5 ผลลัพธ์ที่ได้เห็นได้ชัดเจนเป็นพิเศษบน OpenRouter M2.5 เป็นครั้งแรกที่สร้างเส้นโค้งที่ใกล้เคียงกับเลขชี้กำลัง

ตอบสนองความต้องการจริง ออกแบบใหม่จากพื้นฐาน

เบื้องหลังการพัฒนานี้ มาจากระบบการเรียนรู้แบบเสริมกำลัง Agent ดั้งเดิมที่ MiniMax ออกแบบใหม่จากพื้นฐานทางวิศวกรรม ชื่อรหัส Forge

Forge แยกตรรกะการทำงานของ Agent ออกจากเครื่องมือฝึกฝนและอนุมานพื้นฐานโดยสิ้นเชิง ก่อนหน้านี้ กรอบ RL ส่วนใหญ่ต้องการให้จัดการ Agent เป็นกล่องขาว ระหว่าง Agent กับกรอบต้องแบ่งปันสถานะภายในอย่างลึกซึ้ง เมื่อเกี่ยวข้องกับการจัดการคอนเท็กซ์แบบไดนามิกหรือการทำงานร่วมกันของหลาย Agent ความซับซ้อนทางวิศวกรรมจะขยายตัวอย่างรวดเร็ว; โหมด Token-In-Token-Out แบบดั้งเดิมยังบังคับให้ Agent ผูกมัดอย่างลึกซึ้งกับ Tokenizer พื้นฐาน ทำให้ต้นทุนในการรักษาความสอดคล้องระหว่างการฝึกฝนและการอนุมานสูงมาก

Forge หลีกเลี่ยงสองปัญหานี้โดยการแนะนำชั้นนามธรรม middleware Gateway Server ทำหน้าที่เป็นเกตเวย์สื่อสารมาตรฐาน แยกพฤติกรรมระดับสูงของ Agent ออกจากความซับซ้อนของโมเดลพื้นฐาน; Data Pool รวบรวมเส้นทางการฝึกฝนแบบอะซิงโครนัส ทำให้การสร้างและการฝึกฝนแยกจากกันโดยสิ้นเชิง สถาปัตยกรรมนี้ทำให้ MiniMax สามารถเชื่อมต่อกับกรอบหลายร้อยชนิดและรูปแบบการเรียกใช้เครื่องมือหลายพันชนิดเพื่อฝึกฝน โดยไม่ต้องแก้ไขโค้ดภายในของ Agent เลย

MiniMax M2.5 ระเบิดความต้องการ AI: ปริมาณการใช้งานรายสัปดาห์ทะลุ 3T โอเพนซอร์ส Agent Eco Full Access

ในด้านประสิทธิภาพการฝึกฝน Forge นำเสนอแผนการ Prefix Tree Merging ปรับโครงสร้างตัวอย่างการฝึกฝนจากลำดับเชิงเส้นเป็นโครงสร้างแบบต้นไม้ กำจัดคำนำหน้าคอนเท็กซ์ที่ซ้ำกันจำนวนมากระหว่างคำขอ Agent หลายรอบ ทำให้การฝึกฝนเร็วขึ้นประมาณ 40 เท่า และลดการใช้หน่วยความจำการ์ดแสดงผลอย่างมีนัยสำคัญ

MiniMax M2.5 ระเบิดความต้องการ AI: ปริมาณการใช้งานรายสัปดาห์ทะลุ 3T โอเพนซอร์ส Agent Eco Full Access

ในด้านการจัดตารางแบบอะซิงโครนัส Forge เสนอกลยุทธ์ Windowed FIFO ขณะที่เพิ่มปริมาณงานของระบบให้สูงสุด ควบคุมระดับความเบี่ยงเบนของตัวอย่างผ่านข้อจำกัดหน้าต่างเลื่อน ป้องกันไม่ให้การกระจายการฝึกฝนเบี่ยงเบนไปทางตัวอย่างที่ “เร็วและง่าย” อย่างรุนแรง คำนึงถึงทั้งประสิทธิภาพและความเสถียร

MiniMax M2.5 ระเบิดความต้องการ AI: ปริมาณการใช้งานรายสัปดาห์ทะลุ 3T โอเพนซอร์ส Agent Eco Full Access

ในระดับอัลกอริทึม MiniMax ใช้อัลกอริทึม CISPO ที่พัฒนาขึ้นเองเพื่อรับรองความเสถียรของโมเดล MoE ในการฝึกฝนขนาดใหญ่ และเพื่อแก้ปัญหาการจัดสรรเครดิตของเส้นทางยาวในสถานการณ์ Agent ได้ออกแบบรางวัลประกอบสามส่วน: รางวัลกระบวนการ รางวัลเวลาเสร็จสิ้นงาน และ Reward-to-Go: รางวัลกระบวนการกำกับดูแลพฤติกรรมกลางของ Agent อย่างหนาแน่น ไม่เพียงพึ่งพาผลลัพธ์สุดท้าย; รางวัลเวลาเสร็จสิ้นงานใช้เวลาเสร็จสิ้นสัมพัทธ์เป็นสัญญาณรางวัจ กระตุ้นให้โมเดลใช้กลยุทธ์ขนานเพื่อเลือกเส้นทางการทำงานที่สั้นที่สุดอย่างแข็งขัน; Reward-to-Go ลดความแปรปรวนของเกรเดียนต์อย่างมากผ่านการคืนค่ามาตรฐาน ทำให้กระบวนการเพิ่มประสิทธิภาพเสถียร

นอกจากนี้ MiniMax ยังผสานกลไกการจัดการคอนเท็กซ์เข้ากับวงจรการโต้ตอบ RL โดยตรง ถือเป็นกิจกรรมการทำงานที่ขับเคลื่อนการเปลี่ยนสถานะ ทำให้โมเดลเรียนรู้ที่จะคาดการณ์และปรับตัวกับการเปลี่ยนแปลงของคอนเท็กซ์ในขั้นตอนการฝึกฝน ซึ่งแก้ปัญหาการเจือจางความสนใจที่เกิดขึ้นเมื่อจำนวนรอบการโต้ตอบเพิ่มขึ้นในงานระยะยาวตั้งแต่พื้นฐาน

ระบบนี้เองที่ทำให้ M2.5 แสดงผลลัพธ์ที่เสถียรบน Agent framework ที่มีความต้องการโมเดลค่อนข้างเข้มงวดเช่น Kilo, OpenClaw

ก้าวข้าม Agentic Engineering มุ่งสู่ระบบนิเวศแอปพลิเคชันรุ่นต่อไป

ในช่วง 108 วันที่ผ่านมา MiniMax เปิดตัว M2, M2.1 และ M2.5 ตามลำดับ บนรายการ SWE-Bench Verified อัตราความก้าวหน้าของซีรีส์ M2 เกินกว่าซีรีส์ Claude, GPT และ Gemini เป็นการพัฒนาที่เร็วที่สุดในอุตสาหกรรม

MiniMax M2.5 ระเบิดความต้องการ AI: ปริมาณการใช้งานรายสัปดาห์ทะลุ 3T โอเพนซอร์ส Agent Eco Full Access

จังหวะนี้ ตรงกับหน้าต่างที่ความต้องการระเบิดพอดี OpenClaw จากที่ไม่เป็นที่รู้จักไปสู่การแพร่กระจายไปทั่วโลก ใช้เวลาเพียงหนึ่งหรือสองเดือนเท่านั้น ปัจจุบันบน OpenRouter มีเครื่องมือและแอปพลิเคชันที่คล้ายกันนับพันเติบโตที่นี่ ในระบบนิเวศนอกเหนือจาก “สามผู้ยิ่งใหญ่” ChatGPT, Claude, Gemini นักพัฒนายอมรับเพียงมาตรฐานเดียว: โมเดลทำงานได้หรือไม่ ใช้ได้ในราคาที่จ่ายไหวหรือไม่

ความสามารถอยู่ในระดับชั้นนำ ราคาเพียงหนึ่งในสิบของโมเดลหลักทั่วไป และรองรับการติดตั้งในท้องถิ่น การปรากฏตัวของ MiniMax M2.5 และโมเดลจีนอีกหลายรุ่น ตอกทะลุจุดวิกฤตระหว่างประสิทธิภาพและต้นทุนได้อย่างแม่นยำ ทำให้ระบบหลาย Agent ที่ซับซ้อนซึ่งเคยอยู่เพียงในขั้นตอนสาธิตในชุมชนโอเพนซอร์ส มีความเป็นไปได้ทางเศรษฐกิจสำหรับการนำไปใช้ในเชิงพาณิชย์ขนาดใหญ่เป็นครั้งแรก

ปริมาณการเรียกใช้รายสัปดาห์ทะลุ 3T tokens คือตั๋วความไว้วางใจที่นักพัฒนาลงคะแนนด้วยการกระทำ ตัวเลขนี้ไม่เพียงแสดงถึงการเติบโตของโมเดล M2.5 เอง แต่ยังทำนายการเติบโตโดยรวมของแอปพลิเคชันระบบนิเวศโอเพนซอร์สรุ่นต่อไปของซิลิคอนวัลเลย์

ความต้องการแอปพลิเคชัน Agent ที่ถูกกดดันมานาน กำลังมาถึงช่วงเวลาเริ่มต้นเต็มรูปแบบ


ติดตาม “Whale Habitat” Mini Program เพื่อรับข่าวสาร AI ล่าสุด


⚠️ หมายเหตุ: เนื้อหาได้รับการแปลโดย AI และตรวจสอบโดยมนุษย์ หากมีข้อผิดพลาดโปรดแจ้ง

本文来自网络搜集,不代表คลื่นสร้างอนาคต立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/th/archives/22858

Like (0)
Previous 14 hours ago
Next 14 hours ago

相关推荐