ความก้าวหน้าใหม่ในการวิจัยอิสระของ AI: โครงการ Karpathy กระตุ้นการทำงานร่วมกันของกลุ่มเอเจนต์อัจฉริยะ ทำการทดลองกว่า 2,000 ครั้งใน 4 วัน

1 day ago • การฝึกโมเดลขนาดใหญ่ • 27 views

ความก้าวหน้าใหม่ในการวิจัยอิสระของ AI: โครงการ Karpathy กระตุ้นการทำงานร่วมกันแบบกลุ่มของเอเจนต์ ปฏิบัติการทดลองกว่า 2,000 ครั้งใน 4 วัน

โครงการ Autoresearch ของ Karpathy ใช้โค้ด Python เพียง 630 บรรทัด ทำให้ AI ดำเนินการทดลองอิสระได้ 276 ครั้ง คัดเลือกการปรับปรุงที่มีประสิทธิภาพ 29 รายการ เพิ่มประสิทธิภาพการฝึกโมเดลภาษาประมาณ 11% โดยไม่ต้องมีการแทรกแซงจากมนุษย์ตลอดกระบวนการ

ความก้าวหน้าใหม่ในการวิจัยอิสระของ AI: โครงการ Karpathy กระตุ้นการทำงานร่วมกันของกลุ่มเอเจนต์อัจฉริยะ ทำการทดลองกว่า 2,000 ครั้งใน 4 วัน

อย่างไรก็ตาม ความก้าวหน้าที่น่าสนใจยิ่งกว่านั้นเกิดขึ้นหลังจากนี้ ชุมชนนักพัฒนาทั่วโลกรับช่วงโครงการต่อ และพัฒนาให้ก้าวจาก “AI เดี่ยวทำการทดลอง” เป็น “AI กลุ่มทำงานวิจัยร่วมกัน” พวกเขาสร้างเลเยอร์ความร่วมมือแบบกระจาย (distributed collaboration layer) ทำให้เอเจนต์อัจฉริยะหลายสิบตัวบน GPU ต่าง ๆ สามารถแบ่งปันผลงาน แบ่งหน้าที่ และทำงานร่วมกัน ดำเนินการทดลองมากกว่า 2,000 ครั้งภายใน 4 วัน

เมื่อมนุษย์ตรวจสอบผลลัพธ์ พบว่าเอเจนต์อัจฉริยะ AI ได้ก่อตัวกลไกการทำงานร่วมกันที่คล้ายกับการทบทวนโดยเพื่อนร่วมวิชาชีพ (peer review) ขึ้นมาโดยอัตโนมัติ

AI “ปรับโครงสร้าง” ชุมชนวิทยาศาสตร์

Karpathy เคยชี้แนะทิศทางขั้นต่อไปของโครงการไว้ว่า:

เป้าหมายไม่ใช่การจำลองนักศึกษาปริญญาเอกหนึ่งคน แต่เป็นการจำลองชุมชนการวิจัยทั้งหมด

ชุมชนก็กำลังเดินหน้าไปในทิศทางนั้น โดยได้รับแรงบันดาลใจจาก SETI@home (โครงการคอมพิวเตอร์แบบกระจาย) นักพัฒนาได้เพิ่มเลเยอร์ความร่วมมือบนพื้นฐานของ Autoresearch สร้าง Autoresearch@home ขึ้น ซึ่งอนุญาตให้ผู้ใช้อินเทอร์เน็ตใด ๆ ก็ตามสามารถมีส่วนร่วมในการวิจัยปัญญาประดิษฐ์และการเรียนรู้ของเครื่องได้

เอเจนต์อัจฉริยะสามารถอ่านและเรียนรู้ผลการทดลองในอดีต เพื่อหลีกเลี่ยงการทำงานซ้ำซ้อน และดำเนินการสำรวจอย่างต่อเนื่องบนพื้นฐานของผลงานซึ่งกันและกัน ภายในเวลาไม่ถึงหนึ่งสัปดาห์ ระบบขยายจากเอเจนต์เริ่มต้น 13 ตัว เป็นมากกว่า 80 ตัว ดำเนินการทดลองสะสมมากกว่า 2,000 ครั้ง ระหว่างการทำงาน เอเจนต์ได้เกิดการแบ่งบทบาทโดยอัตโนมัติ:
* เจ้าหน้าที่ทดลอง รับผิดชอบการดำเนินการทดลอง
* เจ้าหน้าที่ตรวจสอบ รับหน้าที่ทำซ้ำผลสรุปของผู้อื่นโดยเฉพาะ
* เจ้าหน้าที่สถิติ วัดความแปรปรวนและระดับความเชื่อมั่น
* เจ้าหน้าที่วิเคราะห์อภิมาน เสนอทิศทางการวิจัยใหม่

ข้อมูลแสดงให้เห็นผลของการแบ่งหน้าที่อย่างชัดเจน: เอเจนต์หนึ่งตัวในหนึ่งวันทุ่มเทให้กับการตรวจสอบข้อกล่าวอ้างของผู้อื่นโดยเฉพาะ ดำเนินการทดลองเสร็จ 188 ครั้ง; กลุ่มเอเจนต์อีกกลุ่มสร้างสมมติฐานการวิจัย 5,895 รายการ แต่ไม่ได้ดำเนินการทดลองใด ๆ ทั้งสิ้น ระบบทั้งหมดเริ่มทำงานเหมือนห้องปฏิบัติการวิจัยแบบกระจาย

ผู้ริเริ่มโครงการ Christine Yip ผู้ก่อตั้ง Ensue ได้เปิดเผยการค้นพบสำคัญ 10 ประการ ซึ่งครอบคลุมหลายด้านตั้งแต่พฤติกรรมการทำงานร่วมกันของเอเจนต์ไปจนถึงเทคนิคการฝึกฝนระดับพื้นฐาน

การค้นพบหลัก ได้แก่:
* จำนวนขั้นการฝึกที่มากขึ้นดีกว่าขนาดแบทช์ที่ใหญ่ขึ้น: การลดขนาดแบทช์ลงครึ่งหนึ่ง พร้อมกับเพิ่มจำนวนขั้นการฝึกเป็นสองเท่า ส่งผลให้ประสิทธิภาพดีขึ้น
* รูปแบบความใส่ใจที่เรียบง่ายให้ผลลัพธ์ดีที่สุด: เอเจนต์หลายตัวค้นพบและยืนยันอย่างอิสระว่ารูปแบบความใส่ใจแบบหน้าต่าง “3 สั้น 1 ยาว” (SSSL) เป็นตัวเลือกที่ดีที่สุด
* การปรับค่าเริ่มต้นสำคัญกว่าการปรับออปติไมเซอร์: การปรับเปลี่ยนเพียงสามรายการที่เกี่ยวข้องกับการกำหนดค่าเริ่มต้น ก็นำมาซึ่งการปรับปรุงที่เห็นได้ชัด
* การทำให้พารามิเตอร์สามารถเรียนรู้ได้ช่วยเพิ่มประสิทธิภาพ: การแทนที่ค่าคงที่ด้วยพารามิเตอร์ที่เรียนรู้ได้ มักจะช่วยเพิ่มประสิทธิภาพของโมเดลเสมอ
* สถาปัตยกรรมที่ดีที่สุดมีขนาดเล็กอย่างน่าประหลาดใจ: การสำรวจของปัญญาร่วมกลุ่มพบว่าการกำหนดค่าที่มี 12 เลเยอร์และมิติ 512 ให้ผลลัพธ์ดีที่สุด การเพิ่มเลเยอร์เครือข่ายอย่างมืดบอดกลับให้ผลลัพธ์ที่แย่ลง
* หลาย “การปรับปรุง” ที่แท้จริงคือสัญญาณรบกวน: เอเจนต์ที่ทำหน้าที่ตรวจสอบโดยเฉพาะพบว่าความแปรปรวนที่เกิดจาก random seed มีขนาดเทียบเท่ากับ “การปรับปรุง” ที่อ้างสิทธิ์จำนวนมาก ส่งผลให้กลุ่มเริ่มเรียกร้องให้มีการทดลองซ้ำและการตรวจสอบด้วยหลาย seed
* เทคนิคที่ยอมรับกันโดยทั่วไปบางส่วนให้ผลลัพธ์ไม่ดี: เทคนิคเช่น weight tying, label smoothing ก่อให้เกิดประสิทธิภาพที่ลดลงในงานนี้ ผลลัพธ์เชิงลบเหล่านี้ถูกบันทึกลงในหน่วยความจำร่วม ช่วยให้เอเจนต์อื่นหลีกเลี่ยงการผิดพลาดซ้ำซ้อน
* ไปป์ไลน์ข้อมูลยังรอการสำรวจ: การทดลองส่วนใหญ่มุ่งเน้นไปที่สถาปัตยกรรมโมเดล ในขณะที่สมมติฐานจำนวนมากเกี่ยวกับการจัดตารางข้อมูลยังไม่ได้รับการทดสอบ ซึ่งอาจซ่อนโอกาสในการก้าวกระโดดที่ใหญ่กว่า
* หน่วยความจำร่วมเร่งกระบวนการค้นพบ: ผลการทดลองที่แบ่งปันกันทำให้เอเจนต์ในภายหลังสามารถเริ่มต้นจากการกำหนดค่าที่ดีที่สุดที่ทราบแล้วได้โดยตรง ซึ่งเร่งกระบวนการวิจัยอย่างมีนัยสำคัญ

เพื่อบรรลุเป้าหมาย เอเจนต์ “แสดงความสามารถพิเศษ”

ในโครงการสืบเนื่องอีกโครงการที่ได้รับแรงบันดาลใจจาก Autoresearch คือ Auto-discovery เอเจนต์อัจฉริยะยังแสดงความสามารถโดดเด่นในงานการค้นพบทางวิทยาศาสตร์และการปรับแต่งอัลกอริทึม และยังสามารถเอาชนะวิธีการอื่น ๆ ที่มีชื่อเสียงในปัญหาการปรับแต่งทางคณิตศาสตร์คลาสสิกบางส่วนได้

ผู้ริเริ่มโครงการ Tu Xinming นักศึกษาปริญญาเอกมหาวิทยาลัยวอชิงตัน ได้แบ่งปันช่วงเวลาการปรับแต่งที่เอเจนต์ “ใช้เส้นทางอื่น” บางส่วน ตัวอย่างเช่น เมื่อไม่ได้ถูกบอกว่า “ห้ามค้นหา” AI ก็ค้นหาทางอินเทอร์เน็ตโดยตรงและพบคำตอบที่ดีที่สุดจากคลังโอเพนซอร์ส ในอีกครั้งหนึ่ง AI เข้าใจข้อจำกัดที่เข้มงวดโดยการอ่านซอร์สโค้ดของตัวประเมิน และออกแบบกลยุทธ์การปรับแต่ง “ที่ตระหนักถึงความคลาดเคลื่อน” โดยเฉพาะเพื่อก้าวหน้าในงาน

ข้อคิดสะท้อน

Karpathy ออกแบบ Autoresearch ด้วยโค้ดเพียง 630 บรรทัด เขาอาจไม่เคยคาดคิดว่าชุมชนจะพัฒนาโครงการนี้ในเวลาเพียงไม่กี่วัน ให้กลายเป็นชุมชนวิทยาศาสตร์แบบกระจายที่มีการทดลอง ตรวจสอบ ทบทวน แบ่งหน้าที่ และแม้แต่ “คลังความรู้ผลลัพธ์เชิงลบ”

การค้นพบที่น่าสนใจที่สุดในการทดลองครั้งนี้อาจไม่ใช่สถาปัตยกรรมโมเดลเฉพาะเจาะจงใด ๆ แต่เป็นกระบวนการวิจัยอิสระและร่วมมือกันนี้เอง

ลิงก์โครงการ
* Autoresearch: https://github.com/karpathy/autoresearch
* Autoresearch@home: https://ensue-network.ai/autoresearch?view=strategies
* Auto-discovery: https://github.com/XinmingTu/auto-discovery

ลิงก์อ้างอิง
[1] https://x.com/christinetyip/status/2032590900107346327
[2] https://x.com/TuXinming/status/2032478765033701835

⚠️ หมายเหตุ: เนื้อหาได้รับการแปลโดย AI และตรวจสอบโดยมนุษย์ หากมีข้อผิดพลาดโปรดแจ้ง

本文来自网络搜集，不代表คลื่นสร้างอนาคต立场，如有侵权，联系删除。转载请注明出处：https://www.itsolotime.com/th/archives/25834