อย่าเพิ่งคุยเรื่องพารามิเตอร์หรือเบนช์มาร์กเลย มาดูอะไรที่ฮาร์ดคอร์กว่านี้ดีกว่า——
ระบบเดสก์ท็อป “macOS Sequoia” เวอร์ชั่นเสี่ยวหมี่ (หัวหมา)

อนิเมชั่นบูตเครื่อง, การเข้าสู่ระบบผู้ใช้, การจัดการหน้าต่าง, การซูม Dock, การค้นหา Spotlight, โหมดสว่าง/มืด, Launchpad ครบครัน
ยังมีแอปพลิเคชันดั้งเดิม 54 ตัวในตัว เปิดเครื่องคิดเลขก็คิดเลขได้ เปิดปฏิทินก็ดูวันที่ได้ เปิดแผนที่ก็ค้นหาที่อยู่ได้ เปิดบันทึกก็จดบันทึกได้ Grapher ก็วาดกราฟ 3D ได้… ลากแล้วหมุนได้ ดูมีสไตล์

ที่เหลือเชื่อกว่านั้นคือ! มีเบราว์เซอร์ Safari ที่ใช้งานอินเทอร์เน็ตได้จริง “Aqqle” แกนี่ (หัวเราะ)

ที่สำคัญคือระบบนี้ถูกสร้างโดย AI ภายใน 4 ชั่วโมงโดยไม่มีการหยุดชะงักหรือการแทรกแซงของมนุษย์ แบบนี้
ใช่แล้ว ใช้ MiMo‑V2.5 Pro ของเสี่ยวหมี่ที่เน้นงานระยะยาวและการทำตามคำสั่งที่คลุมเครือ ซึ่งอยู่ในระดับแนวหน้าของ Agent ฝั่งจีน

ซีรีส์ MiMo‑V2.5 ที่เสี่ยวหมี่เพิ่งเปิดตัว รวมถึงโมเดลหลัก 4 ตัว: Pro Agent ระดับ旗舰, ฐานโมดอลเต็มรูปแบบ, TTS สังเคราะห์เสียง, ASR รู้จำเสียง มีความสามารถโดยรวมเทียบเท่าระดับสากลชั้นนำ

เมื่อเช้ามืดวันนี้ ซีรีส์โมเดล MiMo-V2.5 (รวมเวอร์ชั่น base) ได้ประกาศโอเพนซอร์สอย่างเป็นทางการแล้ว เปิดให้น้ำหนักทั้งหมด
4 เดือน จากการเข้ามาสู่การเป็นระดับแนวหน้าโอเพนซอร์ส เสี่ยวหมี่นักเร่งความเร็วคนนี้ คุ้มค่าที่จะเจาะลึก
นั่งโต๊ะอาหารของโมเดลระดับสากล
ดูก่อนที่ผลงาน
ประการแรก โมเดลรุ่นใหม่มีความสามารถในสามมิติหลัก: ความสามารถ Agent ทั่วไป, วิศวกรรมซอฟต์แวร์ที่ซับซ้อน และงานระยะยาว เพิ่มขึ้นอย่างมีนัยสำคัญเมื่อเทียบกับรุ่นก่อน MiMo-V2-Pro
ในสนามแข่งขันระดับสากล ในการทดสอบเบนช์มาร์ก权威หลายรายการ เช่น Coding Agent, SWE-Bench Pro, GDPVal-AA คะแนนใกล้เคียงกับโมเดลปิดชั้นนำอย่าง Claude Opus 4.6, GPT-5.4 และเหนือกว่า Gemini 3.1 Pro อย่างมาก
แบบนี้ MiMo‑V2.5-Pro ไม่เพียงแต่เข้าสู่ระดับแนวหน้าโอเพนซอร์สของจีน แต่ยังนั่งเทียบเท่ากับโมเดลระดับสากลอย่าง Claude Opus 4.6, GPT-5.4

ถ้าจะพูดถึงจุดสำคัญ การอัปเกรดครั้งนี้ของเสี่ยวหมี่ ส่วนใหญ่คือความสามารถในงานระยะยาวและการทำตามคำสั่งที่คลุมเครือ
ข้อมูลทางการแสดงว่ามันสามารถรองรับงานระยะยาวที่มีการเรียกใช้เครื่องมือมากกว่าพันครั้งได้อย่างเสถียร และทำงานที่ยากซึ่งมนุษย์ผู้เชี่ยวชาญต้องใช้เวลาหลายวันหรือหลายสัปดาห์ได้ด้วยตัวเอง
ยกตัวอย่างโครงการ SysY ของมหาวิทยาลัยปักกิ่ง การเขียนคอมไพเลอร์ที่สมบูรณ์ตั้งแต่เริ่มต้นเป็นวิศวกรรมที่ซับซ้อนระดับนี้ MiMo‑V2.5-Pro สามารถทำได้ตั้งแต่ต้นจนจบ วิเคราะห์คำศัพท์, วิเคราะห์ไวยากรณ์, สร้างโค้ดกลาง, แบ็กเอนด์ RISC-V, ปรับประสิทธิภาพ… รับผิดชอบทั้งหมด
4.3 ชั่วโมง, เรียกใช้เครื่องมือ 672 ครั้ง งานไม่พัง ไม่หลง ไม่ลืม ได้คะแนนเต็ม 233/233

อีกอย่างที่ต้องพูดคือ——ประสิทธิภาพ Token
ในงาน Agent มาตรฐาน ClawEval MiMo ใช้ Token เพียงประมาณ 70,000 ต่อเส้นทางเดียว ก็สามารถถึงอัตราผ่าน Pass³ 64%
ส่วน Claude Opus 4.6, Gemini 3.1 Pro, GPT-5.4 โดยทั่วไปใช้ 120,000-180,000 Token
ความสามารถเท่ากัน ผลลัพธ์เหมือนกัน MiMo ประหยัดต้นทุน 40%-60%

ความสามารถในการประหยัดเงินแบบ “Token ได้ผลสองเท่า” แบบนี้ ต้องชื่นชมจริงๆ

ไม่ใช่แค่โค้ดที่เก่ง ความสามารถด้านเสียงของโมเดลเสี่ยวหมี่ก็ครบครัน
ในตระกูล V2.5 TTS รองรับการสร้างเสียงตามคำอธิบายข้อความ, โคลนนิ่งแบบ zero-shot โดยไม่ต้องอัปโหลดเสียงอ้างอิง ใช้แค่คำอธิบายข้อความก็สร้างเสียงที่ต้องการได้
ASR ถึงระดับ SOTA จีน-อังกฤษ รู้จำภาษากวางตุ้ง, เสฉวน, อู๋, หมิ่นหนานได้ รวมถึงเนื้อเพลงที่มีดนตรีประกอบก็ถอดเสียงได้แม่นยำ

และ MiMo-V2.5-Pro และ MiMo-V2.5 มีหน้าต่างบริบท 1M เป็นมาตรฐาน โมเดลเสียงก็พัฒนาอย่างมาก อัปเกรดทั้งสแต็คตั้งแต่ฐานไปจนถึง TTS, ASR ไม่ตกหล่น
โอเค โอเค เสี่ยวหมี่รอบนี้ไม่ใช่การเจาะจุดเดียว แต่ส่งชุดครอบครัว Agent ทั้งชุดออกมา…
แล้วมันวิ่งได้ดีแค่ไหน? มาทดสอบจริงกัน!
ทดสอบจริง ไม่มีหลอก!
ต้องมาดูเลเยอร์โค้ดของระบบ macOS ที่เกริ่นไว้ตอนต้น เพราะผลลัพธ์มันดีจริง
ทั้งโปรเจกต์สร้างด้วย React 18+TypeScript+Zustand+Tailwind CSS และ Vite มี 68 คอมโพเนนต์รองรับแอปพลิเคชันดั้งเดิม 54 ตัว

ใน XcodeApp มีเอ็นจิ้นเว็บที่เรียกดูได้จริง, เกมเล็กที่มีตรรกะหมากรุกสากลสมบูรณ์, Grapher ที่วาดกราฟ 3D ได้ ฯลฯ

ระบบจัดการหน้าต่างไม่ใช่แค่ป๊อปอัปธรรมดา แต่ทำเครื่องสถานะหน้าต่างที่สมบูรณ์: ลาก, ซูม, ย่อ, ขยาย, สลับโฟกัส, จัดการ z-index, และจำลองตรรกะไฟจราจรสามสีอันเป็นเอกลักษณ์ของ macOS
4 ชั่วโมง MiMo-V2.5 Pro สร้างสถาปัตยกรรมนี้เอง, เติมแอป 54 ตัวทีละตัว, จัดการซิงค์สถานะของหน้าต่างให้เรียบร้อย
ไม่มีการหยุดชะงักหรือแทรกแซงของมนุษย์ตลอด ความสามารถในการเขียนโค้ดนี้ไม่หลอกจริงๆ ปลดปล่อยโปรแกรมเมอร์มนุษย์ได้
จากนั้น ผมเชื่อมต่อโมเดลเข้ากับล็อบสเตอร์ ให้พรอมต์ยาวๆ ให้มันพัฒนาเกมจำลองฟาร์มสไตล์พิกเซล 3D ตั้งแต่เริ่มต้น

อะไรก็ตาม การสร้างฉาก 3D, ศิลปะสไตล์พิกเซล, ระบบการเติบโตของพืช, วงจรสภาพอากาศ, ตรรกะการโต้ตอบผู้เล่น… ใส่ทั้งหมด
MiMo-V2.5 Pro ทำตลอด ตั้งแต่สถาปัตยกรรมไปจนถึงเกมเพลย์หลัก ฟาร์มที่มีปริมาณงานมากและหลายขั้นตอนก็สำเร็จ

เวอร์ชั่นที่ส่งออกมามีคุณภาพสูง ภาพมีพื้นที่ฟาร์มแบ่งเป็นสามสีต่างกัน รอบนอกตกแต่งด้วยดอกไม้และหญ้าสไตล์พิกเซล
ในร้านค้าซื้อพืชแครอท, มะเขือเทศ, ฟักทองได้ ในเกมไม่เพียงมีสภาพอากาศเปลี่ยนระหว่างแดดและฝน แต่ยังมีตัวนับเหรียญที่อัปเดตแบบเรียลไทม์และแถบพลังของตัวละครพิกเซล

มาเริ่มทำนาเถอะ!
สิ่งแรกที่ทำในเกมคือไถนา ถือจอบเดินไปที่空地 ตีๆๆ สักสองสามที ก็ได้พื้นที่เพาะปลูก一块
จากนั้นไปร้านค้าซื้อเมล็ด มะเขือเทศ, ข้าวสาลี, แครอท… เลือกแล้วใส่กระเป๋า กลับมาที่นา ปลูกทีละเมล็ด
ปลูกเสร็จรดน้ำ ดูต้นกล้าโผล่ เมื่อพืชโตเต็มที่จะมีเอฟเฟกต์แวววาว ตอนนี้ก็เก็บเกี่ยวได้ เก็บเสร็จไปขายที่ร้าน เหรียญดังกริ๊งๆ เข้าบัญชี~

จากการตกแต่งฉากไปจนถึงเกมเพลย์หลัก วงจรสมบูรณ์ครบถ้วน ไถนา→รดน้ำ→เก็บเกี่ยว→ขาย→ซื้อเมล็ด→ปลูกอีก… โอเค วนไปไม่หยุด ทำนาไซเบอร์นี่ติดใจมาก!!
ต่อไป ผมใช้ MiMo-V2.5 ทำสมุดบันทึกดิจิทัลสไตล์ธรรมชาติที่ผ่อนคลาย
ต่างจากเกมเล็ก รอบนี้ผมให้แค่คำพูดง่ายๆ:
ช่วยทำเว็บไซต์สไตล์ธรรมชาติที่ผ่อนคลาย เหมือนสมุดบันทึกการเดินทาง ธรรมชาติ เงียบสงบ มีลมหายใจ ความรู้สึกหนีออกจากเมืองไปสู่ทุ่งกว้าง
ไม่ให้สี, ไม่ให้ฟอนต์, ไม่ให้เลย์เอาต์, ไม่ให้แผนภาพเคลื่อนไหว ไม่ให้อะไรเลย

งานประเภทนี้ทดสอบความเข้าใจคำสั่งที่คลุมเครือ ธรรมชาติคือความรู้สึกอะไร? สีที่ผ่อนคลายต้องจับคู่ยังไง?
ความเข้าใจของ MiMo-V2.5 คือ: โทนสีดิน, ฟอนต์ลายมือ, ความรู้สึกหมึก, และอนิเมชั่นนุ่มนวล

แล้วผมก็ได้สมุดบันทึกที่เต็มไปด้วยรายละเอียดและเนื้อหา
พื้นหลังภูเขาทำพารัลแลกซ์ เมื่อเลื่อน ภูเขาใกล้ไกลสร้างความลึก มีอนุภาคเล็กๆ ลอยบนหน้าจอ เลื่อนเมาส์ แสงนุ่มนวลก็ตามมา
คลิกช่องทำเครื่องหมายก็มีอนิเมชั่นเด้ง เมื่อเลื่อนข้อความทั้งหมด แต่ละองค์ประกอบก็ fade in/out บรรยากาศเต็ม

แม้แต่สมุดบันทึกสุดท้ายก็มีฟังก์ชันโต้ตอบ อุปกรณ์ในกระเป๋าสามารถทำเครื่องหมายเลือกได้ การออกแบบเล็กๆ นี้เป็นเซอร์ไพรส์ที่ไม่คาดคิด

ไม่ได้บอกว่าต้องใช้สีอะไร ฟอนต์อะไร มันอ่านจากคำว่าธรรมชาติแล้วเข้าใจบรรยากาศที่ผมต้องการ ทำการโต้ตอบ ภาพ และอนิเมชั่นเอง
ความสามารถในการทำตามคำสั่งที่คลุมเครือแบบนี้ เหมาะที่สุดสำหรับคนทั่วไป ไม่ต้องเขียนพรอมต์เป็น PRD (เอกสารความต้องการผลิตภัณฑ์) พูดภาษาธรรมดาก็ได้สิ่งดีๆ
ดูความสามารถโค้ดเสร็จแล้ว ต้องลองด้านเสียงด้วย!
ให้ MiMo-V2.5-TTS เล่นคนเดียว สร้างเสียงสามบทบาท: เสียงสาววัยรุ่นมีเหตุผล, เสียงเจ้าของตลาดกลางคืนวัยกลางคน, เสียงหนุ่มนักกิน มาโต้วาทีลดน้ำหนัก!
ผลลัพธ์ที่ออกมา… แต่ละเสียงมีรสชาติของตัวเอง ไม่สับสนเลย~
สุดท้ายลอง ASR รู้จำเสียง
ส่งคลิปภาษากวางตุ้งไป ผลการถอดเสียงค่อนข้างแม่นยำ มีแค่ประโยคสุดท้าย “ยินดีต้อนรับสู่ฮ่องกง” ที่ “มา” ฟังผิด แต่ไม่เป็นไร ความแม่นยำถึง 99.999%
ต้องบอกว่า เสี่ยวหมี่รอบนี้เติมเต็มความสามารถเสียงได้อย่างสง่างามจริงๆ 👍
4 เดือน มันเอาของจริงออกมา
ดูผลลัพธ์เสร็จแล้ว สุดท้ายมาคุยเรื่องทีมนี้
จังหวะของทีม AI เสี่ยวหมี่รอบนี้เกินความคาดหมายจริงๆ ตั้งแต่ซีรีส์ V2 ตอนปลายปีที่แล้วเข้ามา จนถึง V2.5 ที่พุ่งถึงระดับแนวหน้าโอเพนซอร์ส ใช้เวลาแค่ 4 เดือน
ในอุตสาหกรรม วงจรการพัฒนาปกติมักใช้ 8 ถึง 12 เดือน แต่เสี่ยวหมี่บีบอัดเวลานี้ลงครึ่งหนึ่ง
ความเร็วที่น่าทึ่งก็พอแล้ว ที่สำคัญคือสายผลิตภัณฑ์ยังครบถ้วนมาก——โมเดลระดับ旗舰, ความสามารถโมดอลเต็มรูปแบบ, โมเดลเสียงครบวงจร อัปเดตทั้งหมดในครั้งเดียว
โอ้โห “เร่ง工期” กลับเร่งออกมาทั้งชุดครอบครัวระดับแนวหน้า นี่เป็นครั้งแรกที่เห็น (doge)

แน่นอน สำหรับผู้ใช้ แม้ความสามารถโมเดลจะสำคัญ แต่ความคุ้มค่าก็เป็นสิ่งที่เราสนใจ
เสี่ยวหมี่ครั้งนี้อัปเกรดโมเดลทั้งซีรีส์เป็นหน้าต่างบริบท 1M แต่ด้วยประสิทธิภาพ Token ที่สูงมาก กลับทำให้กฎการคิดค่าบริการง่ายขึ้น

บริบท 1M และ 256K ใช้ Credit multiplier เท่ากัน: Pro ลดจาก 4x เป็น 2x, มาตรฐานลดจาก 2x เป็น 1x
บวกกับช่วงกลางคืน (เวลา 00:00~08:00 ตามเวลาปักกิ่ง) ลดเพิ่มอีก 20% และ Credits ของผู้ใช้ Token Plan ถูกรีเซ็ตทั้งหมด การผสมผสานนี้ สาระสำคัญคือสองคำ——
การเข้าถึงทั่วไป ให้ผู้ใช้ทั่วไปและนักพัฒนาสัมผัสความสามารถ AI ระดับสูงด้วยต้นทุนต่ำ
ไม่นาน นักพัฒนาต่างประเทศก็ถูกดึงดูดอย่างรวดเร็ว

เทคโนโลยีทำได้ดี การโปรโมทก็ต้องตาม เสี่ยวหมี่เข้าใจเรื่องนี้ดี ดังนั้นนอกจากส่วนลด ก็推出了แผนสนับสนุนนักพัฒนา MiMo Orbit
แผนนี้แบ่งเป็นสองส่วน:
ส่วนหนึ่งคือ แผน激励ผู้สร้าง Token หนึ่งแสนล้าน แจก Token หนึ่งแสนล้านให้กับนักพัฒนา AI ฟรี นักพัฒนา, ทีม และองค์กรทั่วโลกสามารถสมัครเข้าร่วม
และเสี่ยวหมี่จะประเมินทุกใบสมัครอย่างจริงจัง แจกตามความต้องการจริง เพื่อให้ Token ถึงมือคนที่ต้องการจริงๆ
อีกส่วนคือ การสนับสนุนพิเศษสำหรับเฟรมเวิร์ก Agent ใหม่ทั่วโลก ในช่วงเริ่มต้น
ไม่ว่าเฟรมเวิร์กของคุณอยู่ในขั้นตอนไหน มีผู้ใช้ขนาดไหน MiMo ก็ยินดีเป็นโมเดลเอ็นจิ้นพื้นฐานให้
ไม่เพียง เชื่อมต่อฟรี แต่ยังให้การสนับสนุนทางเทคนิคในการปรับเทคโนโลยีพื้นฐาน เพื่อลด门槛ประสบการณ์ผู้ใช้ให้… เกือบเป็นศูนย์
ผมเห็นแล้ว นี่คือการเคลื่อนไหวใหญ่ “จับมือกันเดินไป สร้างชีวิตที่มีความสุข~” (期待.jpg)

เมื่อมองในจุดเวลาปัจจุบัน ก็ไม่ยากที่จะเข้าใจ——
ผู้ผลิตโมเดลต่างประเทศที่มีรากฐานลึกได้วางระบบนิเวศไว้ค่อนข้างมั่นคงแล้ว นิสัยการใช้งานของนักพัฒนาก็定型แล้ว ผู้มาทีหลังจะแทรกเข้าไปไม่ใช่เรื่องง่าย โมเดลจีนต้องการยืนหยัด ความเร็ว, ความสามารถ, และความจริงใจ ต้องครบทั้งสาม
กลยุทธ์ของเสี่ยวหมี่ชัดเจนมาก: ใช้การ迭代ที่เร็วขึ้นเพื่อ抢เวลา ใช้ความสามารถที่แข็งแกร่งขึ้นเพื่อรักษาผู้ใช้ ใช้เงินจริงเพื่อลดต้นทุนการลอง
จะเรียกว่า “แซงทางโค้ง” หรือไม่ไม่แน่ แต่ทัศนคติและการกระทำชัดเจน
ส่วนสุดท้ายจะยืนหยัดได้หรือไม่ ถึงแม้จะขึ้นอยู่กับการเลือกของนักพัฒนา แต่จากคำตอบนี้ ทีม AI เสี่ยวหมี่ทุ่มเทจริงๆ
อีก 4 เดือน มันจะเอาอะไรใหม่ๆ ออกมา? ผมขอรอรอบนึง~
ที่อยู่ทดลอง: https://aistudio.xiaomimimo.com/
กดสามครั้งติดต่อกัน 「ถูกใจ」「แชร์」「หัวใจ」
ยินดีต้อนรับความคิดเห็นในช่องแสดงความคิดเห็น!
— จบ —
🌟 เปิดดาว 🌟
พบความก้าวหน้าทางเทคโนโลยี前沿ทุกวัน
⚠️ หมายเหตุ: เนื้อหาได้รับการแปลโดย AI และตรวจสอบโดยมนุษย์ หากมีข้อผิดพลาดโปรดแจ้ง
☕ สนับสนุนค่ากาแฟทีมงาน
หากคุณชอบบทความนี้ สามารถสนับสนุนเราได้ผ่าน PromptPay
本文来自网络搜集,不代表คลื่นสร้างอนาคต立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/th/archives/32493
