Meta Superintelligence Labs (SML) ได้เปิดตัวผลงานชิ้นสำคัญชิ้นแรก นั่นคือโมเดลที่พัฒนาขึ้นเองใหม่ล่าสุด Muse Spark นี่คือผลงานชิ้นแรกของ Alexander Wang ชาวจีนวัยหนุ่ม หลังจากที่เขาเข้ารับตำแหน่ง Chief AI Officer ของ Meta และนำทีมแผนกนี้

Meta เป็นผู้เล่นสำคัญในวงการ AI แบบ Generative มาตลอด ต้นปี 2023 โมเดลชุด Llama ที่เปิดซอร์สของบริษัทเคยสะสมฐานผู้ใช้จำนวนมหาศาลอย่างรวดเร็ว อย่างไรก็ตาม การเปิดตัว Llama 4 เต็มไปด้วยอุปสรรค ได้รับการประเมินที่หลากหลาย และยังมีข่าวลือว่ามีการจัดการทดสอบมาตรฐานอีกด้วย
เหตุการณ์เหล่านี้ผลักดันให้ Mark Zuckerberg ผู้ก่อตั้งและ CEO ของ Meta ปรับโครงสร้างธุรกิจ AI ของบริษัทใหม่ทั้งหมดในฤดูร้อนปี 2025 ก่อตั้งแผนกภายในใหม่คือ Meta Superintelligence Labs (MSL) Alexander Wang อดีตผู้ร่วมก่อตั้งและ CEO ของ Scale AI ซึ่งอายุเพียง 29 ปี ได้รับเชิญให้ดำรงตำแหน่ง Chief AI Officer เพื่อรับผิดชอบนำทีมแผนกนี้ หลังจากนั้น Meta ได้รับนักวิจัยระดับสูงอีกหลายคน โดยมีเป้าหมายเพื่อฟื้นฟูความแข็งแกร่งในการแข่งขันโมเดลขนาดใหญ่และ Artificial General Intelligence (AGI)
ปัจจุบัน การเปิดตัว Muse Spark ถูกมองว่าเป็นผลงานเบื้องต้นของการปรับกลยุทธ์ชุดนี้
Alexander Wang ระบุบนแพลตฟอร์มโซเชียล X ว่า “วันนี้ Meta เปิดตัว Muse Spark อย่างเป็นทางการ นี่คือโมเดลแรกที่ MSL เปิดตัว เก้าเดือนก่อน เราได้สร้างสแต็กเทคโนโลยี AI ใหม่ทั้งหมดตั้งแต่เริ่มต้น รวมถึงโครงสร้างพื้นฐานใหม่ สถาปัตยกรรมโมเดล และไปป์ไลน์ข้อมูล Muse Spark คือผลลัพธ์ของงานชุดนี้ และตอนนี้มันได้กลายเป็นพลังขับเคลื่อนหลักของ Meta AI แล้ว”

Wang ระบุว่านี่คือโมเดลที่มีความสามารถสูงที่สุดที่ Meta เคยเปิดตัว มีความสามารถขั้นสูงเช่น การเรียกใช้เครื่องมือ โซ่ความคิดแบบภาพ และความร่วมมือของเอเจนต์หลายตัว เขายังเปิดเผยว่า Muse Spark จะเป็นจุดเริ่มต้นของตระกูลโมเดล Muse ใหม่
การเปิดตัวครั้งนี้ยังทำให้เกิดการคาดเดามากมายเกี่ยวกับทิศทางในอนาคตของไลน์ผลิตภัณฑ์ชุด Llama ที่มีอยู่ของ Meta
การกำหนดตำแหน่งโมเดล: รากฐานของ Superintelligence ส่วนบุคคล
การกำหนดตำแหน่งของ Muse Spark ไม่ใช่แชทบอททั่วไป แต่เป็นพื้นฐานสำหรับการสร้าง “Superintelligence ส่วนบุคคล” ตามคำอธิบายของ Wang AI ประเภทนี้มีเป้าหมายเพื่อให้สามารถมองเห็นและเข้าใจโลกรอบตัวผู้ใช้ และกลายเป็นส่วนขยายดิจิทัลของความสามารถส่วนบุคคล วิสัยทัศน์นี้สอดคล้องกับคำประกาศ “Superintelligence ส่วนบุคคล” ที่ Zuckerberg เสนอต่อสาธารณะในฤดูร้อนปี 2025
ปัจจุบัน Muse Spark จำกัดการใช้งานเฉพาะในแอปและเว็บไซต์ Meta AI และให้เข้าถึงผ่าน API ส่วนตัวที่เปิดให้ผู้ใช้บางส่วนเข้าถึงล่วงหน้า Meta ยังไม่ได้ประกาศข้อมูลราคาของโมเดลนี้ และยังไม่ได้ชี้แจงอย่างชัดเจนว่ายังคงพัฒนาชุด Llama ต่อไปหรือไม่
ประสิทธิภาพหลัก
Meta ระบุว่า Muse Spark แสดงความสามารถในการแข่งขันในด้านการรับรู้หลายรูปแบบ การให้เหตุผล งานที่เกี่ยวข้องกับการแพทย์ และงานเอเจนต์อัจฉริยะประเภทต่างๆ

Meta ยังได้เปิดตัวโหมด “Contemplating” (การไตร่ตรองลึกซึ้ง) สำหรับ Muse Spark โหมดนี้สามารถจัดสรรเอเจนต์หลายตัวเพื่อให้เหตุผลแบบขนาน โดยมีเป้าหมายเพื่อให้ความสามารถในการให้เหตุผลเทียบเท่ากับโหมดการให้เหตุผลเข้มข้นของโมเดลล้ำสมัยเช่น Gemini Deep Think และ GPT Pro
ข้อมูลการประเมินแสดงให้เห็นว่าในโหมด Contemplating Muse Spark บรรลุความแม่นยำ 58% ในการทดสอบ Humanity’s Last Exam และ 38% ในการทดสอบ FrontierScience Research

Muse Spark ได้เปิดตัวแล้ว โหมด Contemplating จะค่อยๆ เปิดให้ผู้ใช้ใน meta.ai
แนวโน้มสถานการณ์การใช้งาน
Meta มองว่า Muse Spark เป็นก้าวแรกสู่ Superintelligence ส่วนบุคคล ความสามารถในการให้เหตุผลที่แข็งแกร่งขึ้นของมันถูกมองว่าสามารถรองรับสถานการณ์การใช้งานที่ปรับแต่งเป็นรายบุคคลสูงได้หลายอย่าง
ความสามารถหลายรูปแบบ: Muse Spark เน้นการบูรณาการข้อมูลภาพข้ามโดเมนตั้งแต่เริ่มออกแบบ แสดงความสามารถที่แข็งแกร่งในงานต่างๆ เช่น ปัญหา STEM ประเภทภาพ การจดจำวัตถุ และการระบุตำแหน่งเชิงพื้นที่ ความสามารถเหล่านี้เมื่อบูรณาการแล้ว สามารถรองรับแอปพลิเคชันเชิงโต้ตอบ เช่น การสร้างเกมเล็กๆ ง่ายๆ หรือช่วยผู้ใช้ตรวจสอบปัญหาอุปกรณ์ในบ้านผ่านการติดป้ายกำกับแบบไดนามิก
ด้านสุขภาพ: Meta มองว่า Superintelligence ส่วนบุคคลเป็นทิศทางการนำไปใช้ที่สำคัญในสถานการณ์ด้านสุขภาพ ตามรายงาน บริษัททำงานร่วมกับแพทย์กว่า 1,000 คนเพื่อสร้างข้อมูลฝึกฝน เพื่อเพิ่มความแม่นยำและความสมบูรณ์ของโมเดลในการให้เหตุผลด้านสุขภาพ จากความสามารถเหล่านี้ Muse Spark สามารถสร้างเนื้อหาเชิงโต้ตอบเพื่ออธิบายข้อมูลสุขภาพ เช่น โครงสร้างทางโภชนาการของอาหารหรือกลุ่มกล้ามเนื้อที่เกี่ยวข้องระหว่างการออกกำลังกาย
ตัวอย่างการสาธิต
ต่อไปนี้คือตัวอย่างบางส่วนของศักยภาพการใช้งาน Muse Spark:

ตัวอย่าง: สำหรับผู้ใช้ที่มีความต้องการด้านอาหารเฉพาะ (เช่น ผู้รับประทานมังสวิรัติแบบกินปลาและมีคอเลสเตอรอลสูง) การติดป้ายกำกับส่วนบุคคลและการวิเคราะห์โภชนาการบนภาพอาหาร

ตัวอย่าง: วิเคราะห์ภาพท่าโยคะ ระบุส่วนกล้ามเนื้อที่ยืด ประเมินความยาก และให้คำแนะนำในการแก้ไขและการให้คะแนนประสิทธิภาพ
ตัวอย่าง: ตามคำสั่งของผู้ใช้ แปลงภาพนิ่งเป็นเกมซูโดกุบนเว็บเพจแบบโต้ตอบได้

ตัวอย่าง: ระบุส่วนประกอบอุปกรณ์ทำกาแฟ และสร้างบทเรียนสอนบนเว็บเพจแบบโต้ตอบ เพื่อแนะนำผู้ใช้ในการทำลาเต้
การวิจัยมิติการขยาย
เพื่อให้เกิดการพัฒนาอย่างต่อเนื่องของ Superintelligence ส่วนบุคคล Meta ได้ศึกษาและติดตามความสามารถในการขยายขนาดของ Muse Spark จากสามมิติ: การฝึกล่วงหน้า การเรียนรู้แบบเสริมกำลัง และการให้เหตุผลระหว่างการทดสอบ
การฝึกล่วงหน้า: นี่คือพื้นฐานที่ Muse Spark ได้รับความเข้าใจหลายรูปแบบหลัก การให้เหตุผล และความสามารถในการเขียนโปรแกรม ทีมงานได้ปรับโครงสร้างระบบการฝึกล่วงหน้าใหม่ทั้งหมดในช่วงเก้าเดือนที่ผ่านมา ข้อมูลเปรียบเทียบแสดงให้เห็นว่า เมื่อเทียบกับ Llama 4 Maverick ก่อนหน้านี้ ระบบใหม่สามารถบรรลุระดับประสิทธิภาพเดียวกันด้วยกำลังการคำนวณที่น้อยกว่ามากกว่า 1 อันดับความสำคัญ มีประสิทธิภาพเหนือกว่าโมเดลพื้นฐานหลักที่เทียบเคียงได้ในปัจจุบันอย่างมีนัยสำคัญ

การเรียนรู้แบบเสริมกำลัง: หลังการฝึกล่วงหน้า การเรียนรู้แบบเสริมกำลังถูกใช้เพื่อขยายความสามารถของโมเดลอย่างต่อเนื่อง ภายใต้ระบบใหม่ เมื่อปริมาณการคำนวณการเรียนรู้แบบเสริมกำลังเพิ่มขึ้น ความสามารถของโมเดลแสดงให้เห็นถึงการปรับปรุงที่ราบรื่นและคาดการณ์ได้ และยังแสดงความสามารถในการปรับตัวที่ดีในงานที่ยังไม่เคยพบเห็น
การให้เหตุผลระหว่างการทดสอบ
การเรียนรู้แบบเสริมกำลังทำให้โมเดลสามารถ “คิด” ภายในก่อนสร้างคำตอบสุดท้าย กระบวนการนี้เรียกว่าการให้เหตุผลระหว่างการทดสอบ เพื่อขยายความสามารถดังกล่าวไปยังผู้ใช้หลายพันล้านคนอย่างมีประสิทธิภาพ กุญแจสำคัญอยู่ที่การเพิ่มประสิทธิภาพการใช้โทเค็นการให้เหตุผล Meta พึ่งพาเทคโนโลยีหลักสองประการ: หนึ่งคือการนำ การลงโทษเวลาคิด มาใช้เพื่อเพิ่มประสิทธิภาพโทเค็น สองคือการใช้ ความร่วมมือของเอเจนต์หลายตัว เพื่อเพิ่มประสิทธิภาพของโมเดลโดยไม่เพิ่มความล่าช้าในการตอบสนองอย่างมีนัยสำคัญ
การลงโทษเวลาคิดและการเพิ่มประสิทธิภาพ
เพื่อให้บรรลุเป้าหมาย “ความฉลาดมากขึ้นต่อโทเค็นแต่ละตัว” การฝึกการเรียนรู้แบบเสริมกำลังมีเป้าหมายเพื่อเพิ่มอัตราความถูกต้องของคำตอบสูงสุดภายใต้เงื่อนไขของการลงโทษเวลาคิด ในแบบทดสอบมาตรฐานเช่น AIME กลไกนี้จะทำให้เกิดการเปลี่ยนเฟส: ในช่วงแรกโมเดลจะเพิ่มประสิทธิภาพโดยการขยายโซ่ความคิด แต่เมื่อมีการลงโทษความยาว มันจะเริ่มบีบอัดกระบวนการให้เหตุผล Muse Spark สามารถแก้ปัญหาเดียวกันด้วยโทเค็นที่น้อยลง
หลังจากบีบอัดเบื้องต้นแล้ว โมเดลจะขยายขั้นตอนการให้เหตุผลอีกครั้งในระดับปานกลาง เพื่อเพิ่มประสิทธิภาพโดยรวมให้ดียิ่งขึ้น จึงสร้างสมดุลแบบไดนามิกระหว่างประสิทธิภาพและประสิทธิผล

การให้เหตุผลร่วมกันของเอเจนต์หลายตัว
เพื่อใช้ทรัพยากรการคำนวณมากขึ้นสำหรับการให้เหตุผลระหว่างการทดสอบโดยไม่เพิ่มความล่าช้าอย่างมีนัยสำคัญ สามารถแก้ปัญหาที่ซับซ้อนได้โดยการเพิ่มจำนวนเอเจนต์ที่ทำงานร่วมกันแบบขนาน ดังแสดงในรูปด้านล่าง เมื่อเทียบกับการขยายระหว่างการทดสอบแบบดั้งเดิม (ซึ่งให้เอเจนต์เดียวคิดเป็นเวลานานขึ้น) การขยาย Muse Spark ผ่านความร่วมมือของเอเจนต์หลายตัว สามารถบรรลุประสิทธิภาพที่ดีขึ้นในขณะที่รักษาความเร็วในการตอบสนองที่ใกล้เคียงกัน


ลิงก์อ้างอิง
– https://ai.meta.com/blog/introducing-muse-spark-msl/
– https://venturebeat.com/technology/goodbye-llama-meta-launches-new-proprietary-ai-model-muse-spark-first-since
⚠️ หมายเหตุ: เนื้อหาได้รับการแปลโดย AI และตรวจสอบโดยมนุษย์ หากมีข้อผิดพลาดโปรดแจ้ง
☕ สนับสนุนค่ากาแฟทีมงาน
หากคุณชอบบทความนี้ สามารถสนับสนุนเราได้ผ่าน PromptPay
本文来自网络搜集,不代表คลื่นสร้างอนาคต立场,如有侵权,联系删除。转载请注明出处:http://www.itsolotime.com/th/archives/29354
