MIA หน่วยความจำอัจฉริยะ: ทำให้ AI ลาจาก “การทำงานแบบหลงลืม” และพัฒนาความสามารถอย่างต่อเนื่องจากประสบการณ์

ผู้เขียนร่วมคนแรกของบทความนี้คือนักศึกษาปริญญาเอกจาก Shanghai Chuangzhi College ชื่อ Qiao Jingyang และ Meng Weicheng ผู้เขียนที่ติดต่อคือรองศาสตราจารย์ Zhang Zhizhong จาก East China Normal University และหัวหน้าโครงการคือศาสตราจารย์ Xie Yuan ผู้ได้รับรางวัล National Outstanding Youth

อย่าจดจำสิ่งที่คุณสามารถค้นหาได้
— อัลเบิร์ต ไอน์สไตน์

เอเจนต์อัจฉริยะส่วนใหญ่ในปัจจุบันยังคงทำงานในโหมด “การทำงานแบบไร้ความจำ”: ทุกภารกิจเริ่มต้นการค้นหาจากศูนย์ใหม่ เส้นทางการให้เหตุผลไม่สามารถตกผลึก และประสบการณ์ความล้มเหลวก็ไม่สามารถสะสมได้ แม้ว่าจะรองรับการโต้ตอบหลายรอบ แต่ในสถานการณ์ที่ต้องการการวิจัยเชิงลึก ก็ยากที่จะพัฒนาความสามารถอย่างต่อเนื่อง

เพื่อแก้ไขปัญหานี้ มีการวิจัยที่พยายามสร้างแผนการดำเนินงานโดยอิงจากโซลูชันในอดีต อย่างไรก็ตาม เนื่องจากข้อจำกัดของกระบวนทัศน์การฝึกล่วงหน้า เอเจนต์จำนวนมากจึงตกอยู่ในภาวะกลืนไม่เข้าคายไม่ออกใหม่: “ตัวตัดสินใจ” ที่ไม่ถนัดในการวางแผน ค้นหาข้อมูลชิ้นส่วนที่กระจัดกระจายจากความจำที่พองโต แล้วไปขับเคลื่อน “ตัวดำเนินการ” ที่ขาดความสามารถในการดำเนินการตามแผน ผลลัพธ์คือความจำเติบโตขึ้นเรื่อยๆ แต่ความฉลาดกลับไม่เพิ่มขึ้น

สิ่งนี้นำไปสู่คำถามสำคัญ: มีกลไกใดบ้างที่สามารถเปลี่ยนประสบการณ์ให้เป็นความสามารถของเอเจนต์ได้อย่างแท้จริง?

ทีมวิจัยร่วมจาก Shanghai Chuangzhi College และ East China Normal University ได้เสนอ Memory Intelligence Agent (MIA) เมื่อเร็วๆ นี้ ซึ่งเป็นเฟรมเวิร์กเอเจนต์ความจำอัจฉริยะรุ่นใหม่สำหรับสถานการณ์การวิจัยเชิงลึก เพื่อให้คำตอบใหม่สำหรับคำถามนี้

MIA หน่วยความจำอัจฉริยะ: ทำให้ AI ลาจาก "การทำงานแบบหลงลืม" และพัฒนาความสามารถอย่างต่อเนื่องจากประสบการณ์

  • ที่อยู่บทความ: https://arxiv.org/abs/2604.04503
  • ที่เก็บโค้ด: https://github.com/ECNU-SII/MIA

MIA สร้างระบบความจำที่อิงตามสถาปัตยกรรม “Planner–Executor–Manager” โดยที่ Planner ทำหน้าที่เป็นสมองกลยุทธ์ ไม่เพียงแต่สามารถจัดทำแผนวิจัยสำหรับปัญหาปัจจุบัน แต่ยังสามารถปรับกลยุทธ์แบบเรียลไทม์ผ่านการเรียนรู้อย่างต่อเนื่องระหว่างการทดสอบ Executor เป็นผู้เชี่ยวชาญในการดำเนินการที่ได้รับการฝึกฝน สามารถตีความและปฏิบัติตามพิมพ์เขียวการวิจัยที่ซับซ้อนได้อย่างแม่นยำ Manager ทำหน้าที่เป็นผู้จัดการความจำ มีหน้าที่ในการปรับปรุงการจัดเก็บเพื่อขจัดความซ้ำซ้อน

เมื่อเทียบกับวิธีการที่มีอยู่ จุดเด่นหลักของ MIA คือ:

  1. สร้างกลไกความจำคู่: ความจำแบบไม่ใช้พารามิเตอร์มีหน้าที่ตกผลึกประสบการณ์ ความจำแบบใช้พารามิเตอร์มีหน้าที่ดูดซับความสามารถ ทั้งสองแปลงซึ่งกันและกัน ก่อให้เกิดวงจรวิวัฒนาการอย่างต่อเนื่อง
  2. เสนอโครงสร้างมัลติเอเจนต์ Manager–Planner–Executor: แยกการจัดการความจำ การวางแผนกลยุทธ์ และการดำเนินงานภารกิจออกจากกัน และขับเคลื่อนให้ Planner และ Executor วิวัฒนาการร่วมกันผ่านการเรียนรู้เสริมแบบสลับกัน เพื่อให้เกิดการจัดตำแหน่งระหว่าง “การวางแผน” และ “การดำเนินการ”
  3. นำเสนอกลไกวิวัฒนาการด้วยตนเองสำหรับโลกเปิด: ผสมผสานการไตร่ตรองและการเรียนรู้แบบไม่มีผู้ดูแล ทำให้เอเจนต์สามารถปรับปรุงกลยุทธ์อย่างต่อเนื่องและอัปเดตความจำแบบไดนามิกในระหว่างกระบวนการให้เหตุผลในโลกเปิด เพื่อให้เกิดวิวัฒนาการออนไลน์แบบเรียนรู้ไปด้วยทำไปด้วย

ในหลายภารกิจการวิจัยเชิงลึกทั้งข้อความและมัลติโมดัล MIA ได้ปรับปรุงความเสถียรและประสิทธิภาพของเอเจนต์อย่างมีนัยสำคัญ:

MIA หน่วยความจำอัจฉริยะ: ทำให้ AI ลาจาก "การทำงานแบบหลงลืม" และพัฒนาความสามารถอย่างต่อเนื่องจากประสบการณ์
MIA หน่วยความจำอัจฉริยะ: ทำให้ AI ลาจาก "การทำงานแบบหลงลืม" และพัฒนาความสามารถอย่างต่อเนื่องจากประสบการณ์

  • ประสิทธิภาพ SOTA ก้าวหน้าขึ้นอีก: ในการทดลองเปรียบเทียบ LiveVQA (การค้นหาออนไลน์มัลติโมดัล) และ HotpotQA (การค้นหาแบบแซนด์บ็อกซ์ข้อความล้วน) MIA ปรับปรุงประสิทธิภาพของโมเดลภาษาขนาดใหญ่ขั้นสูงที่มีอยู่ ภายใต้การเรียกใช้เครื่องมือค้นหา อย่างมีนัยสำคัญ
  • บรรลุการก้าวข้ามระดับโดยโมเดลขนาดเล็ก: โมเดล MIA ที่ใช้ Executor ฐาน Qwen-2.5-VL-7B แสดงผลงานโดดเด่นในชุดข้อมูลหลักหลายชุด แซงหน้าข้ามโมเดลขนาดใหญ่ที่ไม่ได้เรียกใช้เครื่องมือ
  • ตั้งมาตรฐานใหม่สำหรับวิธีการด้านความจำ: ในการประเมินเปรียบเทียบแนวนอนกับวิธีการความจำของเอเจนต์อัจฉริยะขั้นสูงในปัจจุบัน MIA บรรลุประสิทธิภาพที่ดีที่สุดในหลายชุดข้อมูล

สรุป

ความจำของเอเจนต์อัจฉริยะไม่ควรหยุดอยู่แค่การจำว่า “ผลลัพธ์คืออะไร” แต่ควรทำให้มันเรียนรู้ว่า “ควรทำอย่างไร” การปรากฏตัวของ MIA ส่งสัญญาณที่ชัดเจน: สิ่งที่กำหนดขีดจำกัดสูงสุดของเอเจนต์อัจฉริยะ ไม่ใช่แค่จำนวนเครื่องมือภายนอกที่มันเชื่อมต่ออีกต่อไป แต่ยังขึ้นอยู่กับว่าในทุกๆ ปฏิสัมพันธ์กับโลก มันสามารถบีบอัด “ข้อมูลกระบวนการ” ที่ซับซ้อนให้กลายเป็น “สัญชาตญาณการดำเนินการ” ที่กระชับได้หรือไม่


⚠️ หมายเหตุ: เนื้อหาได้รับการแปลโดย AI และตรวจสอบโดยมนุษย์ หากมีข้อผิดพลาดโปรดแจ้ง

☕ สนับสนุนค่ากาแฟทีมงาน

หากคุณชอบบทความนี้ สามารถสนับสนุนเราได้ผ่าน PromptPay

PromptPay QR
SCAN TO PAY WITH ANY BANK

本文来自网络搜集,不代表คลื่นสร้างอนาคต立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/th/archives/30982

Like (0)
Previous 1 day ago
Next 4 hours ago

相关推荐