MiniMax M2.5 ระเบิดความต้องการ AI: ปริมาณการใช้งานรายสัปดาห์ทะลุ 3T โอเพนซอร์ส Agent Eco Full Access

2026年2月25日 pm6:43 • ข่าวสารอุตสาหกรรม AI • 251 views

เทศกาลตรุษจีนนี้ MiniMax โด่งดังสุดขีด

วันที่ 20 กุมภาพันธ์ วันแรกของการซื้อขายในตลาดหุ้นฮ่องกงในปีม้า หุ้น MiniMax ปิดตลาดที่เพิ่มขึ้น 14.52% มูลค่าตลาดทะลุ 3.042 แสนล้านดอลลาร์ฮ่องกง

MiniMax M2.5 ระเบิดความต้องการ AI: ปริมาณการใช้งานรายสัปดาห์ทะลุ 3T โอเพนซอร์ส Agent Eco Full Access

การขึ้นราคารอบนี้ไม่ใช่เพียงการระบายอารมณ์ของตลาดทุน

ในช่วงสองปีที่ผ่านมา การเล่าเรื่องในอุตสาหกรรม AI เกือบทั้งหมดมุ่งเน้นไปที่ด้านอุปทาน เช่น โมเดลที่แข็งแกร่งขึ้น ชิปที่เร็วขึ้น และศูนย์ข้อมูลที่ใหญ่ขึ้น อย่างไรก็ตาม สิ่งที่จำกัดการนำ AI ไปใช้ในระดับอุตสาหกรรม นอกจากขีดจำกัดความสามารถด้านอุปทานแล้ว ยังมีอุปสงค์จำนวนมากที่ถูกกดเก็บไว้เป็นเวลานานและยังไม่ได้รับการปลดปล่อยอย่างแท้จริง

ช่วงก่อนและหลังวันหยุดตรุษจีน MiniMax เปิดตัวโมเดลรุ่นใหม่ M2.5 อุปสงค์ที่ถูกกดดันเหล่านี้จึงได้พบทางออก

ภายใน 12 ชั่วโมงหลังเปิดตัว M2.5 ติดอันดับ 1 บน OpenRouter Heat Chart ภายในหนึ่งสัปดาห์ติดอันดับ 1 ในแง่ของปริมาณการเรียกใช้ ปริมาณการเรียกใช้รายสัปดาห์พุ่งสูงถึง 3.07T tokens เกินกว่าผลรวมของ Kimi K2.5, GLM-5 และ DeepSeek V3.2

นี่ยังไม่ใช่ทั้งหมดของเรื่อง ปริมาณการเรียกใช้โดยรวมของ OpenRouter ก็เพิ่มขึ้นพร้อมกันเช่นกัน ทางการยืนยันในภายหลังว่า M2.5 ส่งผลให้เกิดความต้องการเรียกใช้เพิ่มเติมในช่วงข้อความยาว 100K ถึง 1M tokens ซึ่งเป็นช่วงที่ใช้ในสถานการณ์ทั่วไปของ Agent workflow

ก่อนหน้านี้ เนื่องจากไม่สามารถหาโมเดลที่มีทั้งความสามารถและต้นทุนที่ผ่านเกณฑ์ได้ นักพัฒนาจำนวนมากที่มี workflow พร้อมใช้งานจึงไม่สามารถเริ่มต้นได้ งานของ Agent ใช้ tokens หนาแน่นกว่าการสนทนาทั่วไปมาก เมื่อความต้องการถูกกระตุ้น ปริมาณการเรียกใช้ที่เพิ่มขึ้นตามมาจึงค่อนข้างน่าจับตา

สิ่งที่ซิลิคอนวัลเลย์ใช้ กำลังเปลี่ยนแปลงอย่างเงียบๆ

ตั้งแต่ MiniMax เปิดตัวโมเดล M2.1 Kilo Code ผู้ท้าชิงที่แข็งแกร่งที่สุดของ Cursor ที่ได้รับการยอมรับในซิลิคอนวัลเลย์ได้แสดงจุดยืนแล้ว เครื่องมือเขียนโปรแกรม AI ที่สามารถเรียกใช้โมเดลได้มากกว่า 500 รุ่นทั่วโลก เคยประกาศอย่างชัดเจนว่าเลือก MiniMax M2.1 เป็นโมเดลเริ่มต้นในตำแหน่งโมเดลหลักของผลิตภัณฑ์

Breitenother ผู้ร่วมก่อตั้งและ CEO ของ Kilo ให้เหตุผลง่ายๆ ว่า ในการทำงานเขียนโค้ดจริงที่นักพัฒนาตัดสินโดยตรง M2.1 สามารถเทียบเคียงกับโมเดลระดับแนวหน้าได้

หลังจากเปิดตัว M2.5 ครั้งนี้ ก็เปิดตัวแบบโอเพนซอร์สเต็มรูปแบบ น้ำหนักโมเดลเผยแพร่บน HuggingFace รองรับการติดตั้งในท้องถิ่น Kilo ประกาศเชื่อมต่ออีกครั้ง ในเวลาเดียวกัน OpenCode, OpenClaw, Fireworks, Factory, TRAE, Cline, OpenHands, Roo Code รวมถึง Ollama, vLLM, SGLang, Dify, ชุมชนโมด้า และแพลตฟอร์มเครื่องมือโอเพนซอร์สที่มีชื่อเสียงทั้งในและต่างประเทศ ก็เชื่อมต่อทันทีเช่นกัน

Kilo เป็นตัวแทนของทิศทางใหม่ของเครื่องมือเขียนโปรแกรม AI OpenClaw เป็นตัวแทนของ AgentOS ล่าสุด พวกเขามีความเลือกมากในการเลือกโมเดลพื้นฐาน การที่ M2.5 สามารถกลายเป็นตัวเลือกแนะนำอันดับแรกสำหรับผลิตภัณฑ์ประเภทนี้ หมายถึงการยอมรับโมเดลในสภาพแวดล้อมการผลิตจริง

ในการประเมิน SWE-Bench Verified ที่เป็นตัวแทนที่สุดในด้านการเขียนโปรแกรม M2.5 บรรลุระดับเทียบเท่ากับซีรีส์ Claude Opus ด้วยอัตราการผ่าน 80.2% และอยู่อันดับ 1 ในงานหลายภาษา Multi-SWE-Bench

บล็อกเกอร์ด้านเทคนิคชื่อดัง Simon Willison ใช้ mini-swe-agent เพื่อประเมินโมเดลหลักในปัจจุบันอย่างอิสระ ผลลัพธ์แสดงว่า M2.5 อยู่อันดับ 3 รองจาก Claude Opus 4.5 และ Gemini 3 Flash และเป็นอันดับ 1 ในโมเดลโอเพนซอร์ส

ประสิทธิภาพการทำงานก็เพิ่มขึ้นอย่างมีนัยสำคัญเช่นกัน การทดสอบจริงโดยสถาบันวิจัย SemiAnalysis แสดงว่า บนการ์ดแสดงผล H200 8 ใบ M2.5 สามารถรักษาปริมาณงานได้ประมาณ 2500 tokens ต่อ GPU ต่อวินาที ภายใต้ช่วงเวลาแฝงของโทเค็นแรกที่สมเหตุสมผล แม้ภายใต้เงื่อนไขที่ต้องการการโต้ตอบ 20 tokens ต่อผู้ใช้ต่อวินาทีอย่างเข้มงวด เมื่อประมวลผลคอนเท็กซ์ที่มีมากกว่า 10,000 tokens ยังคงรักษาความเร็วในการถอดรหัสที่เสถียรได้

การเชื่อมต่ออย่างหนาแน่นของชุมชน Agent โอเพนซอร์สก็บ่งบอกปัญหาเช่นกัน สำหรับ Agent framework ที่ต้องทำงานเป็นเวลานานและเรียกใช้เครื่องมือบ่อยครั้ง การกำหนดราคาของโมเดลเป็นตัวกำหนดโดยตรงว่าผลิตภัณฑ์จะสามารถดำเนินธุรกิจได้หรือไม่

ช่วงราคาของ M2.5 อยู่ในขอบเขตที่ผลิตภัณฑ์เหล่านี้ยอมรับได้จริง มันมีสองเวอร์ชัน: เวอร์ชันเร็ว 100 TPS ใส่ข้อมูลเพียง 0.3 ดอลลาร์ต่อล้าน tokens เอาต์พุตเพียง 2.4 ดอลลาร์ต่อล้าน tokens; เวอร์ชัน 50 TPS ราคาเอาต์พุตลดลงอีกครึ่งหนึ่ง

ความสามารถ ความเร็ว ต้นทุน สามมิตินี้บรรลุพร้อมกันใน M2.5 ผลลัพธ์ที่ได้เห็นได้ชัดเจนเป็นพิเศษบน OpenRouter M2.5 เป็นครั้งแรกที่สร้างเส้นโค้งที่ใกล้เคียงกับเลขชี้กำลัง

ตอบสนองความต้องการจริง ออกแบบใหม่จากพื้นฐาน

เบื้องหลังการพัฒนานี้ มาจากระบบการเรียนรู้แบบเสริมกำลัง Agent ดั้งเดิมที่ MiniMax ออกแบบใหม่จากพื้นฐานทางวิศวกรรม ชื่อรหัส Forge

Forge แยกตรรกะการทำงานของ Agent ออกจากเครื่องมือฝึกฝนและอนุมานพื้นฐานโดยสิ้นเชิง ก่อนหน้านี้ กรอบ RL ส่วนใหญ่ต้องการให้จัดการ Agent เป็นกล่องขาว ระหว่าง Agent กับกรอบต้องแบ่งปันสถานะภายในอย่างลึกซึ้ง เมื่อเกี่ยวข้องกับการจัดการคอนเท็กซ์แบบไดนามิกหรือการทำงานร่วมกันของหลาย Agent ความซับซ้อนทางวิศวกรรมจะขยายตัวอย่างรวดเร็ว; โหมด Token-In-Token-Out แบบดั้งเดิมยังบังคับให้ Agent ผูกมัดอย่างลึกซึ้งกับ Tokenizer พื้นฐาน ทำให้ต้นทุนในการรักษาความสอดคล้องระหว่างการฝึกฝนและการอนุมานสูงมาก

Forge หลีกเลี่ยงสองปัญหานี้โดยการแนะนำชั้นนามธรรม middleware Gateway Server ทำหน้าที่เป็นเกตเวย์สื่อสารมาตรฐาน แยกพฤติกรรมระดับสูงของ Agent ออกจากความซับซ้อนของโมเดลพื้นฐาน; Data Pool รวบรวมเส้นทางการฝึกฝนแบบอะซิงโครนัส ทำให้การสร้างและการฝึกฝนแยกจากกันโดยสิ้นเชิง สถาปัตยกรรมนี้ทำให้ MiniMax สามารถเชื่อมต่อกับกรอบหลายร้อยชนิดและรูปแบบการเรียกใช้เครื่องมือหลายพันชนิดเพื่อฝึกฝน โดยไม่ต้องแก้ไขโค้ดภายในของ Agent เลย

ในด้านประสิทธิภาพการฝึกฝน Forge นำเสนอแผนการ Prefix Tree Merging ปรับโครงสร้างตัวอย่างการฝึกฝนจากลำดับเชิงเส้นเป็นโครงสร้างแบบต้นไม้ กำจัดคำนำหน้าคอนเท็กซ์ที่ซ้ำกันจำนวนมากระหว่างคำขอ Agent หลายรอบ ทำให้การฝึกฝนเร็วขึ้นประมาณ 40 เท่า และลดการใช้หน่วยความจำการ์ดแสดงผลอย่างมีนัยสำคัญ

ในด้านการจัดตารางแบบอะซิงโครนัส Forge เสนอกลยุทธ์ Windowed FIFO ขณะที่เพิ่มปริมาณงานของระบบให้สูงสุด ควบคุมระดับความเบี่ยงเบนของตัวอย่างผ่านข้อจำกัดหน้าต่างเลื่อน ป้องกันไม่ให้การกระจายการฝึกฝนเบี่ยงเบนไปทางตัวอย่างที่ “เร็วและง่าย” อย่างรุนแรง คำนึงถึงทั้งประสิทธิภาพและความเสถียร

ในระดับอัลกอริทึม MiniMax ใช้อัลกอริทึม CISPO ที่พัฒนาขึ้นเองเพื่อรับรองความเสถียรของโมเดล MoE ในการฝึกฝนขนาดใหญ่ และเพื่อแก้ปัญหาการจัดสรรเครดิตของเส้นทางยาวในสถานการณ์ Agent ได้ออกแบบรางวัลประกอบสามส่วน: รางวัลกระบวนการ รางวัลเวลาเสร็จสิ้นงาน และ Reward-to-Go: รางวัลกระบวนการกำกับดูแลพฤติกรรมกลางของ Agent อย่างหนาแน่น ไม่เพียงพึ่งพาผลลัพธ์สุดท้าย; รางวัลเวลาเสร็จสิ้นงานใช้เวลาเสร็จสิ้นสัมพัทธ์เป็นสัญญาณรางวัจ กระตุ้นให้โมเดลใช้กลยุทธ์ขนานเพื่อเลือกเส้นทางการทำงานที่สั้นที่สุดอย่างแข็งขัน; Reward-to-Go ลดความแปรปรวนของเกรเดียนต์อย่างมากผ่านการคืนค่ามาตรฐาน ทำให้กระบวนการเพิ่มประสิทธิภาพเสถียร

นอกจากนี้ MiniMax ยังผสานกลไกการจัดการคอนเท็กซ์เข้ากับวงจรการโต้ตอบ RL โดยตรง ถือเป็นกิจกรรมการทำงานที่ขับเคลื่อนการเปลี่ยนสถานะ ทำให้โมเดลเรียนรู้ที่จะคาดการณ์และปรับตัวกับการเปลี่ยนแปลงของคอนเท็กซ์ในขั้นตอนการฝึกฝน ซึ่งแก้ปัญหาการเจือจางความสนใจที่เกิดขึ้นเมื่อจำนวนรอบการโต้ตอบเพิ่มขึ้นในงานระยะยาวตั้งแต่พื้นฐาน

ระบบนี้เองที่ทำให้ M2.5 แสดงผลลัพธ์ที่เสถียรบน Agent framework ที่มีความต้องการโมเดลค่อนข้างเข้มงวดเช่น Kilo, OpenClaw

ก้าวข้าม Agentic Engineering มุ่งสู่ระบบนิเวศแอปพลิเคชันรุ่นต่อไป

ในช่วง 108 วันที่ผ่านมา MiniMax เปิดตัว M2, M2.1 และ M2.5 ตามลำดับ บนรายการ SWE-Bench Verified อัตราความก้าวหน้าของซีรีส์ M2 เกินกว่าซีรีส์ Claude, GPT และ Gemini เป็นการพัฒนาที่เร็วที่สุดในอุตสาหกรรม

จังหวะนี้ ตรงกับหน้าต่างที่ความต้องการระเบิดพอดี OpenClaw จากที่ไม่เป็นที่รู้จักไปสู่การแพร่กระจายไปทั่วโลก ใช้เวลาเพียงหนึ่งหรือสองเดือนเท่านั้น ปัจจุบันบน OpenRouter มีเครื่องมือและแอปพลิเคชันที่คล้ายกันนับพันเติบโตที่นี่ ในระบบนิเวศนอกเหนือจาก “สามผู้ยิ่งใหญ่” ChatGPT, Claude, Gemini นักพัฒนายอมรับเพียงมาตรฐานเดียว: โมเดลทำงานได้หรือไม่ ใช้ได้ในราคาที่จ่ายไหวหรือไม่

ความสามารถอยู่ในระดับชั้นนำ ราคาเพียงหนึ่งในสิบของโมเดลหลักทั่วไป และรองรับการติดตั้งในท้องถิ่น การปรากฏตัวของ MiniMax M2.5 และโมเดลจีนอีกหลายรุ่น ตอกทะลุจุดวิกฤตระหว่างประสิทธิภาพและต้นทุนได้อย่างแม่นยำ ทำให้ระบบหลาย Agent ที่ซับซ้อนซึ่งเคยอยู่เพียงในขั้นตอนสาธิตในชุมชนโอเพนซอร์ส มีความเป็นไปได้ทางเศรษฐกิจสำหรับการนำไปใช้ในเชิงพาณิชย์ขนาดใหญ่เป็นครั้งแรก

ปริมาณการเรียกใช้รายสัปดาห์ทะลุ 3T tokens คือตั๋วความไว้วางใจที่นักพัฒนาลงคะแนนด้วยการกระทำ ตัวเลขนี้ไม่เพียงแสดงถึงการเติบโตของโมเดล M2.5 เอง แต่ยังทำนายการเติบโตโดยรวมของแอปพลิเคชันระบบนิเวศโอเพนซอร์สรุ่นต่อไปของซิลิคอนวัลเลย์

ความต้องการแอปพลิเคชัน Agent ที่ถูกกดดันมานาน กำลังมาถึงช่วงเวลาเริ่มต้นเต็มรูปแบบ

ติดตาม “Whale Habitat” Mini Program เพื่อรับข่าวสาร AI ล่าสุด

⚠️ หมายเหตุ: เนื้อหาได้รับการแปลโดย AI และตรวจสอบโดยมนุษย์ หากมีข้อผิดพลาดโปรดแจ้ง

☕ สนับสนุนค่ากาแฟทีมงาน

หากคุณชอบบทความนี้ สามารถสนับสนุนเราได้ผ่าน PromptPay

SCAN TO PAY WITH ANY BANK

本文来自网络搜集，不代表คลื่นสร้างอนาคต立场，如有侵权，联系删除。转载请注明出处：https://www.itsolotime.com/th/archives/22858

Like (0)

0 0

กรอบ COMI: การบีบอัดข้อความยาวที่ชาญฉลาดที่อัตราการบีบอัดสูงผ่านการได้รับข้อมูลส่วนเพิ่ม

Previous 2026年2月25日 pm6:42

หัวเว่ย CLI-Gym: เปิดครั้งแรกเทอร์มินัล Bench ปฏิสัมพันธ์สิ่งแวดล้อมภารกิจขนาดข้อมูลโซลูชั่นที่เพิ่มขึ้น 20%

Next 2026年2月25日 pm6:45

ข่าวสารอุตสาหกรรม AI

ความก้าวหน้าครั้งใหม่ในการให้เหตุผลแบบมัลติโมดัลแบบโอเพนซอร์ส: กรอบ MMFineReason พลิกเกมด้วยพารามิเตอร์ 4B เอาชนะโมเดล 30B เปิดยุคการให้เหตุผลประสิทธิภาพสูงที่ขับเคลื่อนด้วยข้อมูล

เป็นเวลานานมาแล้วที่โมเดลมัลติโมดัลโอเพนซอร์สยังคงมีช่องว่างที่ยากจะก้าวข้ามกับโมเดลปิดต้นแบบชั้นนำอย่าง GPT-4o และ Gemini ในงานที่ต้องใช้การให้เหตุผลที่ซับซ้อน นักพัฒนาชุมชนเริ่มต…

2026年2月13日
167000
ข่าวสารอุตสาหกรรม AI

4.5 พันล้านหงเปาเปิดศึกชิงทางเข้าสู่ AI: Baidu ปั้นเส้นทางผู้ใช้ใหม่ด้วย ‘การค้นหา + AI’

ช่วงตรุษจีนนี้ มีสองเรื่องใหญ่ในแวดวง AI ทั้งในและต่างประเทศที่ดึงดูดความสนใจมากที่สุด: เรื่องหนึ่งคือความนิยมอย่างต่อเนื่องของ OpenClaw และอีกเรื่องคือ สงครามการตลาดช่วงตรุษจีน ขอ…

2026年2月15日
202000
ข่าวสารอุตสาหกรรม AI

MiniMax-M2.5 เปิดตัวอย่างยิ่งใหญ่: AI รุ่นจีนสู้ศึกเทศกาลตรุษจีน ความสามารถในการสร้างเว็บไซต์และการเขียนโปรแกรมอัปเกรดอย่างครอบคลุม

สั่งด้วยประโยคเดียวก็สร้างเกม “Gold Miner” และเว็บไซต์บริษัทที่สวยงามได้ ข่าวจาก Zhidongxi วันที่ 12 กุมภาพันธ์ ใกล้ถึงเทศกาลตรุษจีนแล้ว การแข่งขันระหว่างโมเดล AI ขนาดใ…

2026年2月12日
201000
ข่าวสารอุตสาหกรรม AI

GitHub สุดยอด: 6 เครื่องมือโอเพนซอร์สสุดเจ๋ง ตั้งแต่ศิลปะแผนที่ไปจนถึงถอดรหัสอัลกอริทึม ยกระดับชุดเครื่องมือเทคนิคของคุณ

เครื่องมือสร้างโปสเตอร์แผนที่ นี่คือเครื่องมือโอเพนซอร์สที่ใช้ Python สามารถแปลงข้อมูลแผนที่เมืองให้เป็นโปสเตอร์ศิลปะสไตล์มินิมอลได้ โปรเจกต์นี้ใช้ข้อมูลภูมิศาสตร์จาก OpenStreetMap…

2026年2月5日
182000
ข่าวสารอุตสาหกรรม AI

Nvidia ลงทุน 26 หมื่นล้านดอลลาร์สหรัฐสู่โมเดลโอเพนซอร์ส: จากราชาโครงสร้างพื้นฐาน AI สู่การลงมือขุดทองด้วยตัวเอง

เมื่อวานนี้ เราได้วิเคราะห์บล็อกยาวของ เจนซัน หวง CEO ของ Nvidia เขาชี้ให้เห็นในบทความว่า ปัญญาประดิษฐ์เป็นหนึ่งในพลังที่ทรงอิทธิพลที่สุดในการหล่อหลอมโลกในปัจจุบัน มันไม่ใช่แอปพลิเ…

2026年3月12日
156000

MiniMax M2.5 ระเบิดความต้องการ AI: ปริมาณการใช้งานรายสัปดาห์ทะลุ 3T โอเพนซอร์ส Agent Eco Full Access

☕ สนับสนุนค่ากาแฟทีมงาน

相关推荐

4.5 พันล้านหงเปาเปิดศึกชิงทางเข้าสู่ AI: Baidu ปั้นเส้นทางผู้ใช้ใหม่ด้วย ‘การค้นหา + AI’

Nvidia ลงทุน 26 หมื่นล้านดอลลาร์สหรัฐสู่โมเดลโอเพนซอร์ส: จากราชาโครงสร้างพื้นฐาน AI สู่การลงมือขุดทองด้วยตัวเอง