MIA หน่วยความจำอัจฉริยะ: ทำให้ AI ลาจาก “การทำงานแบบหลงลืม” และพัฒนาความสามารถอย่างต่อเนื่องจากประสบการณ์

4 hours ago • วิศวกรรมโมเดลขนาดใหญ่ • 12 views

ผู้เขียนร่วมคนแรกของบทความนี้คือนักศึกษาปริญญาเอกจาก Shanghai Chuangzhi College ชื่อ Qiao Jingyang และ Meng Weicheng ผู้เขียนที่ติดต่อคือรองศาสตราจารย์ Zhang Zhizhong จาก East China Normal University และหัวหน้าโครงการคือศาสตราจารย์ Xie Yuan ผู้ได้รับรางวัล National Outstanding Youth

อย่าจดจำสิ่งที่คุณสามารถค้นหาได้
— อัลเบิร์ต ไอน์สไตน์

เอเจนต์อัจฉริยะส่วนใหญ่ในปัจจุบันยังคงทำงานในโหมด “การทำงานแบบไร้ความจำ”: ทุกภารกิจเริ่มต้นการค้นหาจากศูนย์ใหม่ เส้นทางการให้เหตุผลไม่สามารถตกผลึก และประสบการณ์ความล้มเหลวก็ไม่สามารถสะสมได้ แม้ว่าจะรองรับการโต้ตอบหลายรอบ แต่ในสถานการณ์ที่ต้องการการวิจัยเชิงลึก ก็ยากที่จะพัฒนาความสามารถอย่างต่อเนื่อง

เพื่อแก้ไขปัญหานี้ มีการวิจัยที่พยายามสร้างแผนการดำเนินงานโดยอิงจากโซลูชันในอดีต อย่างไรก็ตาม เนื่องจากข้อจำกัดของกระบวนทัศน์การฝึกล่วงหน้า เอเจนต์จำนวนมากจึงตกอยู่ในภาวะกลืนไม่เข้าคายไม่ออกใหม่: “ตัวตัดสินใจ” ที่ไม่ถนัดในการวางแผน ค้นหาข้อมูลชิ้นส่วนที่กระจัดกระจายจากความจำที่พองโต แล้วไปขับเคลื่อน “ตัวดำเนินการ” ที่ขาดความสามารถในการดำเนินการตามแผน ผลลัพธ์คือความจำเติบโตขึ้นเรื่อยๆ แต่ความฉลาดกลับไม่เพิ่มขึ้น

สิ่งนี้นำไปสู่คำถามสำคัญ: มีกลไกใดบ้างที่สามารถเปลี่ยนประสบการณ์ให้เป็นความสามารถของเอเจนต์ได้อย่างแท้จริง?

ทีมวิจัยร่วมจาก Shanghai Chuangzhi College และ East China Normal University ได้เสนอ Memory Intelligence Agent (MIA) เมื่อเร็วๆ นี้ ซึ่งเป็นเฟรมเวิร์กเอเจนต์ความจำอัจฉริยะรุ่นใหม่สำหรับสถานการณ์การวิจัยเชิงลึก เพื่อให้คำตอบใหม่สำหรับคำถามนี้

MIA หน่วยความจำอัจฉริยะ: ทำให้ AI ลาจาก "การทำงานแบบหลงลืม" และพัฒนาความสามารถอย่างต่อเนื่องจากประสบการณ์

ที่อยู่บทความ: https://arxiv.org/abs/2604.04503
ที่เก็บโค้ด: https://github.com/ECNU-SII/MIA

MIA สร้างระบบความจำที่อิงตามสถาปัตยกรรม “Planner–Executor–Manager” โดยที่ Planner ทำหน้าที่เป็นสมองกลยุทธ์ ไม่เพียงแต่สามารถจัดทำแผนวิจัยสำหรับปัญหาปัจจุบัน แต่ยังสามารถปรับกลยุทธ์แบบเรียลไทม์ผ่านการเรียนรู้อย่างต่อเนื่องระหว่างการทดสอบ Executor เป็นผู้เชี่ยวชาญในการดำเนินการที่ได้รับการฝึกฝน สามารถตีความและปฏิบัติตามพิมพ์เขียวการวิจัยที่ซับซ้อนได้อย่างแม่นยำ Manager ทำหน้าที่เป็นผู้จัดการความจำ มีหน้าที่ในการปรับปรุงการจัดเก็บเพื่อขจัดความซ้ำซ้อน

เมื่อเทียบกับวิธีการที่มีอยู่ จุดเด่นหลักของ MIA คือ:

สร้างกลไกความจำคู่: ความจำแบบไม่ใช้พารามิเตอร์มีหน้าที่ตกผลึกประสบการณ์ ความจำแบบใช้พารามิเตอร์มีหน้าที่ดูดซับความสามารถ ทั้งสองแปลงซึ่งกันและกัน ก่อให้เกิดวงจรวิวัฒนาการอย่างต่อเนื่อง
เสนอโครงสร้างมัลติเอเจนต์ Manager–Planner–Executor: แยกการจัดการความจำ การวางแผนกลยุทธ์ และการดำเนินงานภารกิจออกจากกัน และขับเคลื่อนให้ Planner และ Executor วิวัฒนาการร่วมกันผ่านการเรียนรู้เสริมแบบสลับกัน เพื่อให้เกิดการจัดตำแหน่งระหว่าง “การวางแผน” และ “การดำเนินการ”
นำเสนอกลไกวิวัฒนาการด้วยตนเองสำหรับโลกเปิด: ผสมผสานการไตร่ตรองและการเรียนรู้แบบไม่มีผู้ดูแล ทำให้เอเจนต์สามารถปรับปรุงกลยุทธ์อย่างต่อเนื่องและอัปเดตความจำแบบไดนามิกในระหว่างกระบวนการให้เหตุผลในโลกเปิด เพื่อให้เกิดวิวัฒนาการออนไลน์แบบเรียนรู้ไปด้วยทำไปด้วย

ในหลายภารกิจการวิจัยเชิงลึกทั้งข้อความและมัลติโมดัล MIA ได้ปรับปรุงความเสถียรและประสิทธิภาพของเอเจนต์อย่างมีนัยสำคัญ:

ประสิทธิภาพ SOTA ก้าวหน้าขึ้นอีก: ในการทดลองเปรียบเทียบ LiveVQA (การค้นหาออนไลน์มัลติโมดัล) และ HotpotQA (การค้นหาแบบแซนด์บ็อกซ์ข้อความล้วน) MIA ปรับปรุงประสิทธิภาพของโมเดลภาษาขนาดใหญ่ขั้นสูงที่มีอยู่ ภายใต้การเรียกใช้เครื่องมือค้นหา อย่างมีนัยสำคัญ
บรรลุการก้าวข้ามระดับโดยโมเดลขนาดเล็ก: โมเดล MIA ที่ใช้ Executor ฐาน Qwen-2.5-VL-7B แสดงผลงานโดดเด่นในชุดข้อมูลหลักหลายชุด แซงหน้าข้ามโมเดลขนาดใหญ่ที่ไม่ได้เรียกใช้เครื่องมือ
ตั้งมาตรฐานใหม่สำหรับวิธีการด้านความจำ: ในการประเมินเปรียบเทียบแนวนอนกับวิธีการความจำของเอเจนต์อัจฉริยะขั้นสูงในปัจจุบัน MIA บรรลุประสิทธิภาพที่ดีที่สุดในหลายชุดข้อมูล

สรุป

ความจำของเอเจนต์อัจฉริยะไม่ควรหยุดอยู่แค่การจำว่า “ผลลัพธ์คืออะไร” แต่ควรทำให้มันเรียนรู้ว่า “ควรทำอย่างไร” การปรากฏตัวของ MIA ส่งสัญญาณที่ชัดเจน: สิ่งที่กำหนดขีดจำกัดสูงสุดของเอเจนต์อัจฉริยะ ไม่ใช่แค่จำนวนเครื่องมือภายนอกที่มันเชื่อมต่ออีกต่อไป แต่ยังขึ้นอยู่กับว่าในทุกๆ ปฏิสัมพันธ์กับโลก มันสามารถบีบอัด “ข้อมูลกระบวนการ” ที่ซับซ้อนให้กลายเป็น “สัญชาตญาณการดำเนินการ” ที่กระชับได้หรือไม่

⚠️ หมายเหตุ: เนื้อหาได้รับการแปลโดย AI และตรวจสอบโดยมนุษย์ หากมีข้อผิดพลาดโปรดแจ้ง

☕ สนับสนุนค่ากาแฟทีมงาน

หากคุณชอบบทความนี้ สามารถสนับสนุนเราได้ผ่าน PromptPay

SCAN TO PAY WITH ANY BANK

本文来自网络搜集，不代表คลื่นสร้างอนาคต立场，如有侵权，联系删除。转载请注明出处：https://www.itsolotime.com/th/archives/30982

Like (0)

0 0

ก่อนวัน IPO ผู้บริหารระดับสูงลาออกพร้อมกัน เกมแห่งอำนาจเบื้องหลังการเปลี่ยนกลยุทธ์ครั้งใหญ่ของ OpenAI

Previous 1 day ago

OpenAI GPT Image 2 เปิดตัวอย่างน่าตื่นเต้น: AI สร้างภาพจนแยกไม่ออก จบยุคแห่งภาพถ่ายเป็นหลักฐาน?

Next 4 hours ago

วิศวกรรมโมเดลขนาดใหญ่

ทีม MiMo ของ Xiaomi เผยเคล็ดลับ: ระบบปักกิ่งสร้างโมเดลระดับโลกชั้นนำอย่างไร?

ทีม MiMo ของ Xiaomi เผยเบื้องหลัง: กลุ่มศิษย์เก่ามหาวิทยาลัยปักกิ่งสร้างโมเดลใหญ่ระดับโลกชั้นนำได้อย่างไร? ในทีม MiMo ของ Xiaomi ผู้ที่มียอดการสนทนา Agent น้อยกว่า 100 ครั้งต่อวัน …

2026年3月20日
188000
วิศวกรรมโมเดลขนาดใหญ่

การตรวจสอบด้วยการขับเคลื่อนการเล่นซ้ำ: วิธีการใหม่ในการก้าวข้ามข้อจำกัดการตรวจสอบก่อนการผลิตชิปในสถาปัตยกรรมชิปเล็ต CPU-GPU

คำสำคัญ: การตรวจสอบแบบขับเคลื่อนด้วยการเล่นซ้ำ, สถาปัตยกรรม CPU-GPU, ชิปเล็ต ODIN, เครือข่ายบนชิป, การตรวจสอบก่อนการผลิตชิป การผสานเทคโนโลยี CPU และ GPU เป็นเทคโนโลยีหลักที่รองรับง…

2026年4月1日
107000
วิศวกรรมโมเดลขนาดใหญ่

เคล็ดลับการพัฒนา Skills ภายใน Anthropic: จากประสบการณ์จริงสู่แนวทางปฏิบัติที่ดีที่สุด

Skills ได้กลายเป็นหนึ่งในวิธีการขยายความสามารถที่ใช้กันอย่างแพร่หลายที่สุดใน Claude Code พวกมันมีความยืดหยุ่น สร้างง่าย และแจกจ่ายได้สะดวก แต่ความยืดหยุ่นนี้ก็มาพร้อมกับปัญหา: มันย…

2026年3月21日
205000
วิศวกรรมโมเดลขนาดใหญ่

สมาร์ทสเปกตรัม GLM-5 เทคโนโลยีอย่างเปิดเผย: ชิปในประเทศปรับตัวได้อย่างเต็มที่ยุคภารกิจยาวเปิด

เผยแพร่เอกสารทางเทคนิค GLM-5 อย่างสมบูรณ์ เอกสารทางเทคนิคเบื้องหลัง GLM-5 ได้รับการเผยแพร่อย่างสมบูรณ์แล้ว ชื่อเอกสารได้ระบุถึงข้อเสนอหลักอย่างชัดเจน: ลาก่อน Vibe Coding ยินดีต้อนร…

2026年2月25日
201000
วิศวกรรมโมเดลขนาดใหญ่

DeepSeek เปิดตัว Mega MoE: ปรับโครงสร้างพื้นฐานใหม่เชื่อมต่อ MoE แบบ Pipeline แบบถาวร เพิ่มอัตราการใช้ GPU พุ่งสูง

เมื่อบ่ายวานนี้ DeepSeek ได้อัปเดตสำคัญครั้งหนึ่งให้กับฐานโค้ดโอเพนซอร์ส DeepGEMM ของตน แกนหลักของการอัปเดตครั้งนี้คือการแนะนำโครงการใหม่ชื่อ Mega MoE Mega MoE มีการนำเสนอโดย Cheng…

2 days ago
35000