ทีม MiMo ของ Xiaomi เผยเคล็ดลับ: ระบบปักกิ่งสร้างโมเดลระดับโลกชั้นนำอย่างไร?

2 hours ago • วิศวกรรมโมเดลขนาดใหญ่ • 13 views

ทีม MiMo ของ Xiaomi เผยเบื้องหลัง: กลุ่มศิษย์เก่ามหาวิทยาลัยปักกิ่งสร้างโมเดลใหญ่ระดับโลกชั้นนำได้อย่างไร?

ในทีม MiMo ของ Xiaomi ผู้ที่มียอดการสนทนา Agent น้อยกว่า 100 ครั้งต่อวัน ขอให้ลาออกไปได้เลย

ทันทีที่โมเดล MiMo-V2-Pro ของ Xiaomi ขึ้นแท่นอันดับหนึ่งในชาร์ตการเรียกใช้ของ OpenRouter Luo Fuli ก็โพสต์บทความแบ่งปันความคิดเห็นเกี่ยวกับการบริหารทีมของเธอ ความร้อนแรงเชื่อมต่อกันแทบจะไม่มีรอยต่อ สายตาของชาวเน็ตก็หันจากตัวโมเดลมาสู่ทีม MiMo ของ Xiaomi

ทีม MiMo ของ Xiaomi เผยเคล็ดลับ: ระบบปักกิ่งสร้างโมเดลระดับโลกชั้นนำอย่างไร?

ตั้งแต่เปิดตัวโมเดลเหตุผลใหญ่ตัวแรก MiMo-7B เป็นต้นมา ยังไม่ถึงหนึ่งปี เส้นความสามารถของ MiMo แสดงให้เห็นการเพิ่มขึ้นอย่างรวดเร็วอย่างชัดเจน และในเวลาอันสั้นก็ได้ก้าวเข้าสู่กลุ่มแนวหน้าของโลก

ทีม MiMo ของ Xiaomi เผยเคล็ดลับ: ระบบปักกิ่งสร้างโมเดลระดับโลกชั้นนำอย่างไร?

ในทางตรงกันข้าม ห้องปฏิบัติการซูเปอร์อินเทลลิเจนซ์ของ Meta ที่ลงทุนหนักไม่แพ้กัน กลับถูกเลื่อนกำหนดการบ่อยครั้งในช่วงไม่กี่มื้อนี้ และถูกเปิดเผยว่าโมเดลมีประสิทธิภาพต่ำกว่าโมเดลแนวหน้าที่เปิดตัวก่อนหน้านี้มาก ดังนั้น หลายคนเริ่มสงสัย: ทีม MiMo ของ Xiaomi เป็นทีมแบบไหนกันแน่ ถึงสามารถสร้างโมเดลที่ได้รับความสนใจจากทั่วโลกได้ภายในเวลาเพียงไม่กี่เดือน?

ทีม MiMo ของ Xiaomi เผยเคล็ดลับ: ระบบปักกิ่งสร้างโมเดลระดับโลกชั้นนำอย่างไร?

เป็นที่ทราบกันดีว่าการพัฒนาโมเดลใหญ่เป็นการต่อสู้แบบกองทัพ หลังการ์ดโมเดลมักเป็นปัญญาร่วมของนักวิจัยหลายคน ตามข่าวภายในเผย ทีม LLM ของ Xiaomo ค่อนข้างลึกลับภายในองค์กร แต่จากการรวบรวมบันทึกการเปิดตัวโมเดลและบทความวิจัยในช่วงครึ่งปีที่ผ่านมา ยังพอติดตามร่องรอยบางอย่างได้ — ผู้เขียนหลักส่วนใหญ่มาจากมหาวิทยาลัยปักกิ่ง ในนั้น甚至有师弟ของ Luo Fuli เอง สิ่งที่น่าสนใจยิ่งกว่านั้นคือ มหาวิทยาลัยปักกิ่งยังเป็นแหล่งกำเนิดของ DeepSeek อดีตที่ทำงานของ Luo Fuli อีกด้วย

เกี่ยวกับทีม MiMo ของ Xiaomi

การเคลื่อนไหวล่าสุดของทีม MiMo ของ Xiaomi ได้รับความสนใจจากภายนอกอย่างกว้างขวาง ความสนใจนี้เชื่อมโยงอย่างแยกไม่ออกกับ “การขับเคลื่อนด้วยจังหวะสูง” ของทีมทั้งในด้านผลิตภัณฑ์และการตีพิมพ์บทความวิจัย เมื่อผลงานวิจัยหลายชิ้นถูกเปิดเผยออกมาตามลำดับ สมาชิกหลักของทีมก็ปรากฏตัวขึ้น

ผู้มีส่วนร่วมหลักในรายงานเทคนิค MiMo-7B

Xiao Bangjun (Bangjun Xiao) ผู้เขียนคนแรก ของ MiMo-V2-Flash จบการศึกษาระดับปริญญาตรีและปริญญาเอกจากมหาวิทยาลัยปักกิ่ง

ทีม MiMo ของ Xiaomi เผยเคล็ดลับ: ระบบปักกิ่งสร้างโมเดลระดับโลกชั้นนำอย่างไร?

อาจารย์ที่ปรึกษาปริญญาเอกของเขาคือศาสตราจารย์ Huang Gang รองคณบดีสถาบันวิจัยปัญญาประดิษฐ์ มหาวิทยาลัยปักกิ่ง ทิศทางการวิจัยของเขามุ่งเน้นไปที่ Edge Computing และ Federated Learning และก่อนหน้านี้ก็เคย涉猎 Computer Vision และ Diffusion Model

Bingquan Xia หนึ่งในผู้เขียนหลักของ MiMo-V2-Flash จบการศึกษาระดับปริญญาโทจากสถาบันเทคโนโลยีคอมพิวเตอร์ Chinese Academy of Sciences ปี 2021

ทีม MiMo ของ Xiaomi เผยเคล็ดลับ: ระบบปักกิ่งสร้างโมเดลระดับโลกชั้นนำอย่างไร?

Ma Wenhan (Wenhan Ma) เริ่มศึกษาระดับปริญญาเอกที่คณะวิทยาการคอมพิวเตอร์ มหาวิทยาลัยปักกิ่ง ตั้งแต่เดือนกันยายน 2025 ภายใต้การดูแลของศาสตราจารย์ Sui Zhifang

ทิศทางการวิจัยของเขาคือ Large Language Model โดยล่าสุดมุ่งเน้นไปที่การเพิ่มความสามารถในการให้เหตุผลของ Large Language Model จบการศึกษาระดับปริญญาตรีจากคณะวิศวกรรมอิเล็กทรอนิกส์และวิทยาการคอมพิวเตอร์ มหาวิทยาลัยปักกิ่ง สาขาวิทยาการคอมพิวเตอร์และเทคโนโลยี สิ่งที่น่าสนใจคือ ศาสตราจารย์ Sui Zhifang เป็นอาจารย์ที่ปรึกษาของ Luo Fuli ที่มหาวิทยาลัยปักกิ่ง และ Ma Wenhan เป็นรุ่นน้องร่วมสำนักกับ Luo Fuli

Luo Fuli (แถวหลังที่สองจากซ้าย) ถ่ายภาพร่วมกับอาจารย์ที่ปรึกษา ศาสตราจารย์ Sui Zhifang (แถวหน้าที่สองจากขวา)

Zhu Dawei (Dawei Zhu) นักศึกษาปริญญาเอกปี 3 มหาวิทยาลัยปักกิ่ง อาจารย์ที่ปรึกษาคือศาสตราจารย์ Li Sujian จบการศึกษาระดับปริญญาตรีจากคณะวิศวกรรมอิเล็กทรอนิกส์และวิทยาการคอมพิวเตอร์ มหาวิทยาลัยปักกิ่ง

ทีม MiMo ของ Xiaomi เผยเคล็ดลับ: ระบบปักกิ่งสร้างโมเดลระดับโลกชั้นนำอย่างไร?

ทิศทางการวิจัยคือ Long Context Modeling เขาเชื่อว่าการประมวลผลบริบทที่ยาวมากอย่างมีประสิทธิภาพเป็นความสามารถสำคัญของโมเดลภาษาและโมเดลมัลติโมดัลในอนาคต และยังสนใจความก้าวหน้าของ Agent, Alignment และโมเดลมัลติโมดัลด้วย ก่อนหน้านี้ โครงการ “paperbanana” ที่เขาเข้าร่วมเคยได้รับความสนใจค่อนข้างมาก

ทีม MiMo ของ Xiaomi เผยเคล็ดลับ: ระบบปักกิ่งสร้างโมเดลระดับโลกชั้นนำอย่างไร?

Dong Jinhao อาจารย์ประจำคณะสารสนเทศศาสตร์ มหาวิทยาลัยเหรินหมินแห่งจีน / ห้องปฏิบัติการหลักกระทรวงศึกษาธิการด้านวิศวกรรมข้อมูลและวิศวกรรมความรู้ และยังเป็นที่ปรึกษาด้านเทคนิคของทีมหลัก Large Language Model (LLM) ของ Xiaomi รับผิดชอบหลักในการพัฒนา LLM ที่เกี่ยวข้องกับโค้ด รวมถึงการฝึกล่วงหน้า การเรียนรู้แบบเสริมกำลัง และทิศทางของ Agent

ทีม MiMo ของ Xiaomi เผยเคล็ดลับ: ระบบปักกิ่งสร้างโมเดลระดับโลกชั้นนำอย่างไร?

เขาเป็นผู้นำในการจัดตั้งห้องปฏิบัติการร่วมหลักพื้นฐาน Large Language Model ระหว่างมหาวิทยาลัยเหรินหมินและ Xiaomi และเป็นสมาชิกคณะกรรมการเทคนิค เขาจบการศึกษาระดับปริญญาเอกจากคณะวิทยาการคอมพิวเตอร์ มหาวิทยาลัยปักกิ่ง และจบการศึกษาระดับปริญญาตรีจากมหาวิทยาลัยซีอานเตี้ยนจื่อ สาขาวิทยาการคอมพิวเตอร์และเทคโนโลยี

Zhang Hailin สมาชิกทีม MiMo ของ Xiaomi มุ่งเน้นไปที่การสร้างโครงสร้างพื้นฐาน AI สร้างโครงสร้างพื้นฐานการเรียนรู้แบบเสริมกำลัง (RL) ที่มีประสิทธิภาพ ขยายขนาดได้ และมีเสถียรภาพสำหรับชุดโมเดล MiMo

ทีม MiMo ของ Xiaomi เผยเคล็ดลับ: ระบบปักกิ่งสร้างโมเดลระดับโลกชั้นนำอย่างไร?

เขาได้รับปริญญาเอกสาขาวิทยาการคอมพิวเตอร์จากมหาวิทยาลัยปักกิ่งในปี 2025 ภายใต้การดูแลของศาสตราจารย์ Cui Bin และเคยได้รับรางวัลวิทยานิพนธ์ปริญญาเอกดีเด่นของมหาวิทยาลัยปักกิ่ง จุดเน้นการวิจัยรวมถึง Large Language Models (LLMs) ขนาดใหญ่, Deep Learning Recommendation Models (DLRMs), Information Retrieval (IR) และการคำนวณแบบกระจายทั่วไป

นอกจากนี้ ยังมีผู้เขียนหลักอีกหลายคน แต่ข้อมูลสาธารณะมีน้อย บางส่วนมีหน้า Google Homepage ดังนี้:

ทีม MiMo ของ Xiaomi เผยเคล็ดลับ: ระบบปักกิ่งสร้างโมเดลระดับโลกชั้นนำอย่างไร?

ทีม MiMo ของ Xiaomi เป็นทีมแบบไหน

ทีมที่ก่อตั้งมาเพียงหนึ่งหรือสองปี สามารถก้าวขึ้นสู่แถวหน้าของการวิจัยและพัฒนาโมเดลชั้นนำได้ ไม่ได้พึ่งพาเพียงจังหวะผลิตภัณฑ์และสมาชิกหลักเท่านั้น เมื่อตรวจสอบภูมิหลังของทีมอย่างละเอียด จะพบลักษณะร่วมที่ชัดเจน — มีภูมิหลังจากมหาวิทยาลัยปักกิ่งอย่างหนาแน่น ตั้งแต่สมาชิกหลักไปจนถึงกำลังหลักด้านเทคนิค สมาชิกทีมหลายคนจบการศึกษาระดับปริญญาตรีหรือปริญญาเอกจากคณะวิทยาการคอมพิวเตอร์ มหาวิทยาลัยปักกิ่ง

ด้านหนึ่ง ความสัมพันธ์ร่วมสำนัก ระบบอาจารย์ที่ปรึกษา และการสืบทอดจากคณะและมหาวิทยาลัยของมหาวิทยาลัยปักกิ่ง ทำให้ Xiaomi ในฐานะผู้มาใหม่ในอุตสาหกรรมโมเดลใหญ่ สามารถดูดซับเลือดใหม่ได้อย่างต่อเนื่อง อีกด้านหนึ่ง นักศึกษาก็สามารถเข้าสู่อุตสาหกรรมได้อย่างรวดเร็ว ใช้ประโยชน์จากพลังการคำนวณและทรัพยากรที่อุดมสมบูรณ์ เพื่อนำความคิดวิจัยไปปฏิบัติและปรับปรุงอย่างมีประสิทธิภาพ ในกระบวนการนี้ Luo Fuli กลายเป็นสะพานสำคัญระหว่างทีมและภูมิหลังทางวิชาการของมหาวิทยาลัยปักกิ่ง

นอกจากอิทธิพลของภูมิหลังมหาวิทยาลัยต่อแนวคิดผลิตภัณฑ์ของสมาชิกแล้ว แนวคิดด้านเทคนิคของทีม MiMo ของ Xiaomi ยังได้รับแรงขับเคลื่อนจากยีนผลิตภัณฑ์ขององค์กร Xiaomi อย่างมาก — หลักคือ “ความคุ้มค่า” ในระดับผลิตภัณฑ์ และแนวคิด “ระบบนิเวศอินเทอร์เน็ต” ที่สอดคล้องกับบริษัท สิ่งที่สะท้อนให้เห็นชัดเจนที่สุดในโมเดล MiMo คือ ขนาดพารามิเตอร์ 7B กลยุทธ์โอเพ่นซอร์ส และทิศทางการปรับใช้บนอุปกรณ์ปลายทาง ซึ่งแสดงให้เห็นอย่างชัดเจนถึงการวางแผนเชิงกลยุทธ์และแนวคิดระบบนิเวศของ Xiaomi

ดังนั้น ความสำเร็จของ MiMo จึงไม่ใช่เรื่องบังเอิญ แต่เป็นผลจากการซ้อนทับของหลายปัจจัย: ความลึกของภูมิหลังการวิจัยของมหาวิทยาลัยปักกิ่ง ประสบการณ์ด้านเทคนิคของสมาชิกหลัก และการขับเคลื่อนโดยยีนผลิตภัณฑ์และวิศวกรรมของ Xiaomi ร่วมกันหล่อหลอมให้ทีมรุ่นใหม่นี้เติบโตขึ้นอย่างรวดเร็ว

ยังมีรายละเอียดเล็กน้อยที่น่าสนใจอีกอย่างที่ควรกล่าวถึง — Lin Junyang อดีตหัวหน้าโมเดลใหญ่ Qwen ของห้องปฏิบัติการ Tongyi ที่เพิ่งลาออกจาก Alibaba เมื่อไม่นานมานี้ เป็นรุ่นพี่ของ Luo Fuli ทั้งคู่ต่างศึกษาวิจัยด้าน Natural Language Processing ที่เกี่ยวข้องในระดับปริญญาโทที่มหาวิทยาลัยปักกิ่ง มีเส้นทางวิชาการที่คล้ายคลึงกันมาก หลังจบการศึกษาก็เข้าร่วม Damo Academy ของ Alibaba ตามลำดับ มีพื้นฐานทางเทคนิคและมุมมองอุตสาหกรรมที่ใกล้เคียงกันในการวิจัยและพัฒนาโมเดลใหญ่ คนหนึ่งเคยทำ Qwen อีกคนนำทีม MiMo บุคคลสำคัญของเส้นโมเดลชั้นนำภายในประเทศสองเส้น เคยเติบโตมาในระบบวิชาการและอุตสาหกรรมเดียวกัน ความสัมพันธ์ระดับนี้เองก็ทำให้หลายคนในวงการหันมามอง

⚠️ หมายเหตุ: เนื้อหาได้รับการแปลโดย AI และตรวจสอบโดยมนุษย์ หากมีข้อผิดพลาดโปรดแจ้ง

本文来自网络搜集，不代表คลื่นสร้างอนาคต立场，如有侵权，联系删除。转载请注明出处：http://www.itsolotime.com/th/archives/26516