ซีรี่ย์โมเดล MiMo-V2 ของ Xiaomi เปิดตัวแบบไม่ระบุตัวตนทำให้เกิดการคาดเดา สามโมเดลเปิดตัวพร้อมกันผลักดัน AI จากบทสนทนาไปสู่การปฏิบัติภารกิจ

สัปดาห์ที่แล้ว มีโมเดลที่ไม่ระบุชื่อสองตัวปรากฏตัวบนแพลตฟอร์มรวม API ชื่อดังอย่าง OpenRouter โดยใช้รหัสว่า “Hunter Alpha” และ “Healer Alpha” โดยไม่มีการประชาสัมพันธ์อย่างเป็นทางการใดๆ แต่จำนวนการเรียกใช้กลับเพิ่มขึ้นอย่างรวดเร็วในอัตราที่ผิดปกติ ซีรี่ย์โมเดล MiMo-V2 ของ Xiaomi เปิดตัวแบบไม่ระบุตัวตนทำให้เกิดการคาดเดา สามโมเดลเปิดตัวพร้อมกันผลักดัน AI จากบทสนทนาไปสู่การปฏิบัติภารกิจ

ในจำนวนนี้ Hunter Alpha ติดอันดับหนึ่งในรายการประจำวันของแพลตฟอร์มหลายวันติดต่อกัน มียอดการเรียกใช้สะสมเกิน 1 ล้านล้านโทเค็น สร้างความสงสัยอย่างกว้างขวางในชุมชน ความคิดเห็นหลักเชื่อว่ามันน่าจะมาจาก DeepSeek อาจเป็นเวอร์ชันทดสอบภายในของ DeepSeek V4 ซีรี่ย์โมเดล MiMo-V2 ของ Xiaomi เปิดตัวแบบไม่ระบุตัวตนทำให้เกิดการคาดเดา สามโมเดลเปิดตัวพร้อมกันผลักดัน AI จากบทสนทนาไปสู่การปฏิบัติภารกิจ คำถามสาธารณะของ Peter Steinberger ผู้ก่อตั้ง OpenClaw บนแพลตฟอร์ม X ทำให้การอภิปรายร้อนแรงขึ้นไปอีก

ความลับถูกเปิดเผยในไม่ช้า Xiaomi ประกาศอย่างเป็นทางการว่า Hunter Alpha และ Healer Alpha เป็นเวอร์ชันทดสอบภายในช่วงแรกของโมเดลขนาดใหญ่ชุด MiMo-V2 ของบริษัท Luo Fuli หัวหน้าทีมโมเดลขนาดใหญ่ MiMo ของ Xiaomi ก็ออกมายืนยันการเป็นเจ้าของบนแพลตฟอร์ม X เช่นกัน ซีรี่ย์โมเดล MiMo-V2 ของ Xiaomi เปิดตัวแบบไม่ระบุตัวตนทำให้เกิดการคาดเดา สามโมเดลเปิดตัวพร้อมกันผลักดัน AI จากบทสนทนาไปสู่การปฏิบัติภารกิจ ที่น่าสนใจคือ Luo Fuli เคยเป็นนักวิจัยของ DeepSeek ซึ่งช่วยอธิบายได้บางส่วนว่าทำไมชุมชนถึงเชื่อมโยงโมเดลนี้กับ DeepSeek ในตอนแรก ซีรี่ย์โมเดล MiMo-V2 ของ Xiaomi เปิดตัวแบบไม่ระบุตัวตนทำให้เกิดการคาดเดา สามโมเดลเปิดตัวพร้อมกันผลักดัน AI จากบทสนทนาไปสู่การปฏิบัติภารกิจ

ครั้งนี้ Xiaomi เปิดตัวโมเดลสามรุ่นพร้อมกัน แม้แต่ละรุ่นจะมีจุดเน้นต่างกัน แต่ทั้งหมดมุ่งสู่เป้าหมายหลักเดียวกัน: ผลักดันให้ AI พัฒนาจาก “การสนทนาโต้ตอบ” ไปสู่ “การปฏิบัติงาน”

  • MiMo-V2-Pro: โมเดลพื้นฐานข้อความระดับแฟลกชิป ออกแบบมาสำหรับสถานการณ์ทำงานของเอเจนต์ (Agent) ที่มีความเข้มข้นสูง เน้นความสามารถในการใช้เหตุผลที่ซับซ้อน การวางแผนงาน และการเรียกใช้เครื่องมือ
  • MiMo-V2-Omni: โมเดลพื้นฐานเอเจนต์ออลโมดัล ผสานการรับรู้ข้อความ ภาพ และเสียงแบบเนทีฟตั้งแต่ต้น มีเป้าหมายเพื่อเชื่อมโยงสายโซ่ทั้งหมดตั้งแต่การเข้าใจสภาพแวดล้อมไปจนถึงการดำเนินการโดยอัตโนมัติ
  • MiMo-V2-TTS: โมเดลขนาดใหญ่สำหรับสังเคราะห์เสียง เป้าหมายคือมอบเสียงที่มีอารมณ์และความแสดงออกให้กับเอเจนต์ เพื่อเป็นส่วนสุดท้ายของสแต็กการปฏิบัติงาน ซีรี่ย์โมเดล MiMo-V2 ของ Xiaomi เปิดตัวแบบไม่ระบุตัวตนทำให้เกิดการคาดเดา สามโมเดลเปิดตัวพร้อมกันผลักดัน AI จากบทสนทนาไปสู่การปฏิบัติภารกิจ

MiMo-V2-Pro: เน้นการใช้เหตุผลและความคุ้มค่า

MiMo-V2-Pro มีพารามิเตอร์ทั้งหมดเกิน 1 ล้านล้านพารามิเตอร์ โดยมีพารามิเตอร์ที่เปิดใช้งาน 42,000 ล้านพารามิเตอร์ ในขณะที่รักษาประสิทธิภาพการอนุมานที่สูง ก็ยังสนับสนุนหน้าต่างบริบทที่ยาวสูงสุดถึง 1 ล้านโทเค็น ซึ่งให้ข้อได้เปรียบเชิงโครงสร้างสำหรับการจัดการงานเอเจนต์ที่ยาวและซับซ้อน ซีรี่ย์โมเดล MiMo-V2 ของ Xiaomi เปิดตัวแบบไม่ระบุตัวตนทำให้เกิดการคาดเดา สามโมเดลเปิดตัวพร้อมกันผลักดัน AI จากบทสนทนาไปสู่การปฏิบัติภารกิจ

บนบัญชีประเมินผลรวมโมเดลขนาดใหญ่ที่มีชื่อเสียงอย่าง Artificial Analysis MiMo-V2-Pro ติดอันดับที่แปดของโลก ซีรี่ย์โมเดล MiMo-V2 ของ Xiaomi เปิดตัวแบบไม่ระบุตัวตนทำให้เกิดการคาดเดา สามโมเดลเปิดตัวพร้อมกันผลักดัน AI จากบทสนทนาไปสู่การปฏิบัติภารกิจ ในการประเมินความสามารถจริง Xiaomi เน้นย้ำว่าในด้านการสร้างโค้ด งานเอเจนต์ทั่วไป และการเรียกใช้เครื่องมือ โมเดลนี้อยู่ในระดับเดียวกับ Claude Sonnet 4.6 โดยความสามารถด้านวิศวกรรมโค้ดใกล้เคียงกับ Claude Opus 4.6 แล้ว

กลยุทธ์การกำหนดราคาเป็นจุดเด่นอีกประการ ราคา API ของ MiMo-V2-Pro อยู่ที่ประมาณหนึ่งในห้าของคู่แข่งระดับเดียวกัน มีเป้าหมายเพื่อดึงดูดระบบนิเวศนักพัฒนาด้วยความคุ้มค่าสูงในเวลาอันรวดเร็ว ขณะนี้ บริการ API ของมันได้เปิดให้ใช้งานอย่างเป็นทางการแล้ว

MiMo-V2-Omni: โมเดลออลโมดัลที่รวมการรับรู้และการกระทำเป็นหนึ่งเดียว

MiMo-V2-Omni เป็นโมเดลออลโมดัลแรกของ Xiaomi ที่รวมการรับรู้และการกระทำเป็นหนึ่งเดียวในระดับพื้นฐาน ความสามารถในการเข้าใจเสียงสนับสนุนการวิเคราะห์เสียงยาวต่อเนื่องเกิน 10 ชั่วโมง ความเข้าใจภาพโดดเด่นในการใช้เหตุผลข้ามสาขาวิชาและการวิเคราะห์แผนภูมิที่ซับซ้อน ส่วนความเข้าใจวิดีโอใช้สถาปัตยกรรมการป้อนข้อมูลวิดีโอและเสียงร่วมกันแบบเนทีฟ ซีรี่ย์โมเดล MiMo-V2 ของ Xiaomi เปิดตัวแบบไม่ระบุตัวตนทำให้เกิดการคาดเดา สามโมเดลเปิดตัวพร้อมกันผลักดัน AI จากบทสนทนาไปสู่การปฏิบัติภารกิจ

ในสถานการณ์ปฏิบัติจริง มันสามารถทำงานที่ซับซ้อนแบบ end-to-end ได้ ตัวอย่างเช่น ในการทดสอบสามารถควบคุมเบราว์เซอร์เพื่อค้นหาข้อมูล เปรียบเทียบราคา สื่อสารกับพนักงานบริการลูกค้าจนกระทั่งทำการสั่งซื้อสำเร็จ บนแบบทดสอบมาตรฐานเอเจนต์ข้อความล้วน PinchBench ผลการดำเนินงานของมันเทียบเคียงได้กับโมเดลระดับสูงสุด ซีรี่ย์โมเดล MiMo-V2 ของ Xiaomi เปิดตัวแบบไม่ระบุตัวตนทำให้เกิดการคาดเดา สามโมเดลเปิดตัวพร้อมกันผลักดัน AI จากบทสนทนาไปสู่การปฏิบัติภารกิจ

โมเดลนี้ได้ร่วมมือกับ Kingsoft Office แล้ว เชื่อมต่อกับ WPS Lingxi สนับสนุนการสร้างเอกสารสำนักงานประเภทต่างๆ โดยตรง API ของมันก็ได้เปิดให้ใช้งานพร้อมกันแล้ว

MiMo-V2-TTS: ใส่เสียงที่มีอารมณ์ให้กับเอเจนต์

MiMo-V2-TTS ถูกฝึกด้วยข้อมูลเสียงขนาดใหญ่ มีเป้าหมายเพื่อแก้ปัญหา “การเปล่งเสียง” ของเอเจนต์ มันสนับสนุนการควบคุมอารมณ์ในหลายระดับ สามารถเปลี่ยนน้ำเสียงภายในประโยคเดียวกัน และสามารถระบุสัญญาณรูปแบบในข้อความอย่างชาญฉลาดเพื่อแปลงเป็นการแสดงออกทางเสียงที่ธรรมชาติ

โมเดลยังมีความสามารถในการสนับสนุนภาษาถิ่น การแสดงบทบาทตามสไตล์ต่างๆ และการสังเคราะห์เสียงรัก อนาคต มีแผนที่จะผสานรวมอย่างลึกซึ้งกับ MiMo-V2-Omni เพื่อให้เอเจนต์ไม่เพียงแต่ “มองเห็น” โลกได้ แต่ยังสามารถ “เล่าเรื่อง” โลกได้อย่างมีชีวิตชีวา

ความสำคัญเชิงกลยุทธ์: ขับเคลื่อนศูนย์กลางอัจฉริยะของ “ระบบนิเวศครบวงจรคน-รถ-บ้าน”

การเปิดตัวโมเดลทั้งสามรุ่นพร้อมกันไม่ใช่เรื่องบังเอิญ Luo Fuli เปิดเผยว่าทีมงานได้วางแผนโมเดลพารามิเตอร์ใหญ่และสถาปัตยกรรมนวัตกรรมเช่นการให้ความสนใจแบบผสมมานานแล้ว และมีความมุ่งมั่นอย่างแน่วแน่ต่อการเปลี่ยนผ่านรูปแบบของเอเจนต์ ซีรี่ย์โมเดล MiMo-V2 ของ Xiaomi เปิดตัวแบบไม่ระบุตัวตนทำให้เกิดการคาดเดา สามโมเดลเปิดตัวพร้อมกันผลักดัน AI จากบทสนทนาไปสู่การปฏิบัติภารกิจ

โมเดลทั้งสามรุ่นนี้ประกอบเป็นสแต็กความสามารถ AI ที่สมบูรณ์: MiMo-V2-Pro รับผิดชอบการวางแผนการใช้เหตุผล MiMo-V2-Omni รับผิดชอบการรับรู้หลายรูปแบบและการปฏิบัติงาน MiMo-V2-TTS รับผิดชอบการโต้ตอบด้วยเสียง พวกมันกำลังถูกบูรณาการเข้ากับกลยุทธ์ “ระบบนิเวศครบวงจรคน-รถ-บ้าน” ของ Xiaomi

เอเจนต์ AI บนสมาร์ทโฟน “miclaw” ได้เชื่อมต่อกับโมเดลขนาดใหญ่ MiMo แล้ว มีความสามารถในการดำเนินการระดับระบบ การเชื่อมต่อกับแอปพลิเคชันต่างๆ เช่น WPS เบราว์เซอร์ Xiaomi แสดงให้เห็นว่า MiMo กำลังกลายเป็นชั้นความสามารถพื้นฐานที่ฝังตัวอยู่ในสถานการณ์ต่างๆ สิ่งนี้หมายความว่า Xiaomi กำลังใช้ AI ที่ขับเคลื่อนโดย Agent เพื่อใส่ศูนย์กลางอัจฉริยะที่เป็นหนึ่งเดียวให้กับระบบนิเวศฮาร์ดแวร์ที่เชื่อมต่อถึงกันของบริษัท


⚠️ หมายเหตุ: เนื้อหาได้รับการแปลโดย AI และตรวจสอบโดยมนุษย์ หากมีข้อผิดพลาดโปรดแจ้ง

本文来自网络搜集,不代表คลื่นสร้างอนาคต立场,如有侵权,联系删除。转载请注明出处:http://www.itsolotime.com/th/archives/26418

Like (0)
Previous 12 hours ago
Next 2026年2月19日 pm12:12

相关推荐