ทีม MiMo ของ Xiaomi เผยเบื้องหลัง: กลุ่มศิษย์เก่ามหาวิทยาลัยปักกิ่งสร้างโมเดลใหญ่ระดับโลกชั้นนำได้อย่างไร?
ในทีม MiMo ของ Xiaomi ผู้ที่มียอดการสนทนา Agent น้อยกว่า 100 ครั้งต่อวัน ขอให้ลาออกไปได้เลย
ทันทีที่โมเดล MiMo-V2-Pro ของ Xiaomi ขึ้นแท่นอันดับหนึ่งในชาร์ตการเรียกใช้ของ OpenRouter Luo Fuli ก็โพสต์บทความแบ่งปันความคิดเห็นเกี่ยวกับการบริหารทีมของเธอ ความร้อนแรงเชื่อมต่อกันแทบจะไม่มีรอยต่อ สายตาของชาวเน็ตก็หันจากตัวโมเดลมาสู่ทีม MiMo ของ Xiaomi

ตั้งแต่เปิดตัวโมเดลเหตุผลใหญ่ตัวแรก MiMo-7B เป็นต้นมา ยังไม่ถึงหนึ่งปี เส้นความสามารถของ MiMo แสดงให้เห็นการเพิ่มขึ้นอย่างรวดเร็วอย่างชัดเจน และในเวลาอันสั้นก็ได้ก้าวเข้าสู่กลุ่มแนวหน้าของโลก

ในทางตรงกันข้าม ห้องปฏิบัติการซูเปอร์อินเทลลิเจนซ์ของ Meta ที่ลงทุนหนักไม่แพ้กัน กลับถูกเลื่อนกำหนดการบ่อยครั้งในช่วงไม่กี่มื้อนี้ และถูกเปิดเผยว่าโมเดลมีประสิทธิภาพต่ำกว่าโมเดลแนวหน้าที่เปิดตัวก่อนหน้านี้มาก ดังนั้น หลายคนเริ่มสงสัย: ทีม MiMo ของ Xiaomi เป็นทีมแบบไหนกันแน่ ถึงสามารถสร้างโมเดลที่ได้รับความสนใจจากทั่วโลกได้ภายในเวลาเพียงไม่กี่เดือน?

เป็นที่ทราบกันดีว่าการพัฒนาโมเดลใหญ่เป็นการต่อสู้แบบกองทัพ หลังการ์ดโมเดลมักเป็นปัญญาร่วมของนักวิจัยหลายคน ตามข่าวภายในเผย ทีม LLM ของ Xiaomo ค่อนข้างลึกลับภายในองค์กร แต่จากการรวบรวมบันทึกการเปิดตัวโมเดลและบทความวิจัยในช่วงครึ่งปีที่ผ่านมา ยังพอติดตามร่องรอยบางอย่างได้ — ผู้เขียนหลักส่วนใหญ่มาจากมหาวิทยาลัยปักกิ่ง ในนั้น甚至有师弟ของ Luo Fuli เอง สิ่งที่น่าสนใจยิ่งกว่านั้นคือ มหาวิทยาลัยปักกิ่งยังเป็นแหล่งกำเนิดของ DeepSeek อดีตที่ทำงานของ Luo Fuli อีกด้วย
เกี่ยวกับทีม MiMo ของ Xiaomi
การเคลื่อนไหวล่าสุดของทีม MiMo ของ Xiaomi ได้รับความสนใจจากภายนอกอย่างกว้างขวาง ความสนใจนี้เชื่อมโยงอย่างแยกไม่ออกกับ “การขับเคลื่อนด้วยจังหวะสูง” ของทีมทั้งในด้านผลิตภัณฑ์และการตีพิมพ์บทความวิจัย เมื่อผลงานวิจัยหลายชิ้นถูกเปิดเผยออกมาตามลำดับ สมาชิกหลักของทีมก็ปรากฏตัวขึ้น
ผู้มีส่วนร่วมหลักในรายงานเทคนิค MiMo-7B
Xiao Bangjun (Bangjun Xiao) ผู้เขียนคนแรก ของ MiMo-V2-Flash จบการศึกษาระดับปริญญาตรีและปริญญาเอกจากมหาวิทยาลัยปักกิ่ง

อาจารย์ที่ปรึกษาปริญญาเอกของเขาคือศาสตราจารย์ Huang Gang รองคณบดีสถาบันวิจัยปัญญาประดิษฐ์ มหาวิทยาลัยปักกิ่ง ทิศทางการวิจัยของเขามุ่งเน้นไปที่ Edge Computing และ Federated Learning และก่อนหน้านี้ก็เคย涉猎 Computer Vision และ Diffusion Model
Bingquan Xia หนึ่งในผู้เขียนหลักของ MiMo-V2-Flash จบการศึกษาระดับปริญญาโทจากสถาบันเทคโนโลยีคอมพิวเตอร์ Chinese Academy of Sciences ปี 2021

Ma Wenhan (Wenhan Ma) เริ่มศึกษาระดับปริญญาเอกที่คณะวิทยาการคอมพิวเตอร์ มหาวิทยาลัยปักกิ่ง ตั้งแต่เดือนกันยายน 2025 ภายใต้การดูแลของศาสตราจารย์ Sui Zhifang
ทิศทางการวิจัยของเขาคือ Large Language Model โดยล่าสุดมุ่งเน้นไปที่การเพิ่มความสามารถในการให้เหตุผลของ Large Language Model จบการศึกษาระดับปริญญาตรีจากคณะวิศวกรรมอิเล็กทรอนิกส์และวิทยาการคอมพิวเตอร์ มหาวิทยาลัยปักกิ่ง สาขาวิทยาการคอมพิวเตอร์และเทคโนโลยี สิ่งที่น่าสนใจคือ ศาสตราจารย์ Sui Zhifang เป็นอาจารย์ที่ปรึกษาของ Luo Fuli ที่มหาวิทยาลัยปักกิ่ง และ Ma Wenhan เป็นรุ่นน้องร่วมสำนักกับ Luo Fuli
Luo Fuli (แถวหลังที่สองจากซ้าย) ถ่ายภาพร่วมกับอาจารย์ที่ปรึกษา ศาสตราจารย์ Sui Zhifang (แถวหน้าที่สองจากขวา)
Zhu Dawei (Dawei Zhu) นักศึกษาปริญญาเอกปี 3 มหาวิทยาลัยปักกิ่ง อาจารย์ที่ปรึกษาคือศาสตราจารย์ Li Sujian จบการศึกษาระดับปริญญาตรีจากคณะวิศวกรรมอิเล็กทรอนิกส์และวิทยาการคอมพิวเตอร์ มหาวิทยาลัยปักกิ่ง

ทิศทางการวิจัยคือ Long Context Modeling เขาเชื่อว่าการประมวลผลบริบทที่ยาวมากอย่างมีประสิทธิภาพเป็นความสามารถสำคัญของโมเดลภาษาและโมเดลมัลติโมดัลในอนาคต และยังสนใจความก้าวหน้าของ Agent, Alignment และโมเดลมัลติโมดัลด้วย ก่อนหน้านี้ โครงการ “paperbanana” ที่เขาเข้าร่วมเคยได้รับความสนใจค่อนข้างมาก

Dong Jinhao อาจารย์ประจำคณะสารสนเทศศาสตร์ มหาวิทยาลัยเหรินหมินแห่งจีน / ห้องปฏิบัติการหลักกระทรวงศึกษาธิการด้านวิศวกรรมข้อมูลและวิศวกรรมความรู้ และยังเป็นที่ปรึกษาด้านเทคนิคของทีมหลัก Large Language Model (LLM) ของ Xiaomi รับผิดชอบหลักในการพัฒนา LLM ที่เกี่ยวข้องกับโค้ด รวมถึงการฝึกล่วงหน้า การเรียนรู้แบบเสริมกำลัง และทิศทางของ Agent

เขาเป็นผู้นำในการจัดตั้งห้องปฏิบัติการร่วมหลักพื้นฐาน Large Language Model ระหว่างมหาวิทยาลัยเหรินหมินและ Xiaomi และเป็นสมาชิกคณะกรรมการเทคนิค เขาจบการศึกษาระดับปริญญาเอกจากคณะวิทยาการคอมพิวเตอร์ มหาวิทยาลัยปักกิ่ง และจบการศึกษาระดับปริญญาตรีจากมหาวิทยาลัยซีอานเตี้ยนจื่อ สาขาวิทยาการคอมพิวเตอร์และเทคโนโลยี
Zhang Hailin สมาชิกทีม MiMo ของ Xiaomi มุ่งเน้นไปที่การสร้างโครงสร้างพื้นฐาน AI สร้างโครงสร้างพื้นฐานการเรียนรู้แบบเสริมกำลัง (RL) ที่มีประสิทธิภาพ ขยายขนาดได้ และมีเสถียรภาพสำหรับชุดโมเดล MiMo

เขาได้รับปริญญาเอกสาขาวิทยาการคอมพิวเตอร์จากมหาวิทยาลัยปักกิ่งในปี 2025 ภายใต้การดูแลของศาสตราจารย์ Cui Bin และเคยได้รับรางวัลวิทยานิพนธ์ปริญญาเอกดีเด่นของมหาวิทยาลัยปักกิ่ง จุดเน้นการวิจัยรวมถึง Large Language Models (LLMs) ขนาดใหญ่, Deep Learning Recommendation Models (DLRMs), Information Retrieval (IR) และการคำนวณแบบกระจายทั่วไป
นอกจากนี้ ยังมีผู้เขียนหลักอีกหลายคน แต่ข้อมูลสาธารณะมีน้อย บางส่วนมีหน้า Google Homepage ดังนี้:

ทีม MiMo ของ Xiaomi เป็นทีมแบบไหน
ทีมที่ก่อตั้งมาเพียงหนึ่งหรือสองปี สามารถก้าวขึ้นสู่แถวหน้าของการวิจัยและพัฒนาโมเดลชั้นนำได้ ไม่ได้พึ่งพาเพียงจังหวะผลิตภัณฑ์และสมาชิกหลักเท่านั้น เมื่อตรวจสอบภูมิหลังของทีมอย่างละเอียด จะพบลักษณะร่วมที่ชัดเจน — มีภูมิหลังจากมหาวิทยาลัยปักกิ่งอย่างหนาแน่น ตั้งแต่สมาชิกหลักไปจนถึงกำลังหลักด้านเทคนิค สมาชิกทีมหลายคนจบการศึกษาระดับปริญญาตรีหรือปริญญาเอกจากคณะวิทยาการคอมพิวเตอร์ มหาวิทยาลัยปักกิ่ง
ด้านหนึ่ง ความสัมพันธ์ร่วมสำนัก ระบบอาจารย์ที่ปรึกษา และการสืบทอดจากคณะและมหาวิทยาลัยของมหาวิทยาลัยปักกิ่ง ทำให้ Xiaomi ในฐานะผู้มาใหม่ในอุตสาหกรรมโมเดลใหญ่ สามารถดูดซับเลือดใหม่ได้อย่างต่อเนื่อง อีกด้านหนึ่ง นักศึกษาก็สามารถเข้าสู่อุตสาหกรรมได้อย่างรวดเร็ว ใช้ประโยชน์จากพลังการคำนวณและทรัพยากรที่อุดมสมบูรณ์ เพื่อนำความคิดวิจัยไปปฏิบัติและปรับปรุงอย่างมีประสิทธิภาพ ในกระบวนการนี้ Luo Fuli กลายเป็นสะพานสำคัญระหว่างทีมและภูมิหลังทางวิชาการของมหาวิทยาลัยปักกิ่ง
นอกจากอิทธิพลของภูมิหลังมหาวิทยาลัยต่อแนวคิดผลิตภัณฑ์ของสมาชิกแล้ว แนวคิดด้านเทคนิคของทีม MiMo ของ Xiaomi ยังได้รับแรงขับเคลื่อนจากยีนผลิตภัณฑ์ขององค์กร Xiaomi อย่างมาก — หลักคือ “ความคุ้มค่า” ในระดับผลิตภัณฑ์ และแนวคิด “ระบบนิเวศอินเทอร์เน็ต” ที่สอดคล้องกับบริษัท สิ่งที่สะท้อนให้เห็นชัดเจนที่สุดในโมเดล MiMo คือ ขนาดพารามิเตอร์ 7B กลยุทธ์โอเพ่นซอร์ส และทิศทางการปรับใช้บนอุปกรณ์ปลายทาง ซึ่งแสดงให้เห็นอย่างชัดเจนถึงการวางแผนเชิงกลยุทธ์และแนวคิดระบบนิเวศของ Xiaomi
ดังนั้น ความสำเร็จของ MiMo จึงไม่ใช่เรื่องบังเอิญ แต่เป็นผลจากการซ้อนทับของหลายปัจจัย: ความลึกของภูมิหลังการวิจัยของมหาวิทยาลัยปักกิ่ง ประสบการณ์ด้านเทคนิคของสมาชิกหลัก และการขับเคลื่อนโดยยีนผลิตภัณฑ์และวิศวกรรมของ Xiaomi ร่วมกันหล่อหลอมให้ทีมรุ่นใหม่นี้เติบโตขึ้นอย่างรวดเร็ว
ยังมีรายละเอียดเล็กน้อยที่น่าสนใจอีกอย่างที่ควรกล่าวถึง — Lin Junyang อดีตหัวหน้าโมเดลใหญ่ Qwen ของห้องปฏิบัติการ Tongyi ที่เพิ่งลาออกจาก Alibaba เมื่อไม่นานมานี้ เป็นรุ่นพี่ของ Luo Fuli ทั้งคู่ต่างศึกษาวิจัยด้าน Natural Language Processing ที่เกี่ยวข้องในระดับปริญญาโทที่มหาวิทยาลัยปักกิ่ง มีเส้นทางวิชาการที่คล้ายคลึงกันมาก หลังจบการศึกษาก็เข้าร่วม Damo Academy ของ Alibaba ตามลำดับ มีพื้นฐานทางเทคนิคและมุมมองอุตสาหกรรมที่ใกล้เคียงกันในการวิจัยและพัฒนาโมเดลใหญ่ คนหนึ่งเคยทำ Qwen อีกคนนำทีม MiMo บุคคลสำคัญของเส้นโมเดลชั้นนำภายในประเทศสองเส้น เคยเติบโตมาในระบบวิชาการและอุตสาหกรรมเดียวกัน ความสัมพันธ์ระดับนี้เองก็ทำให้หลายคนในวงการหันมามอง
⚠️ หมายเหตุ: เนื้อหาได้รับการแปลโดย AI และตรวจสอบโดยมนุษย์ หากมีข้อผิดพลาดโปรดแจ้ง
本文来自网络搜集,不代表คลื่นสร้างอนาคต立场,如有侵权,联系删除。转载请注明出处:http://www.itsolotime.com/th/archives/26516
