สถาปัตยกรรม OpenClaw (กุ้งก้ามกราม) ที่เคยได้รับความนิยมอย่างมากกำลังเผชิญกับความท้าทายที่ไม่เคยมีมาก่อน การปรากฏตัวของสิ่งมีชีวิต AI สองสายพันธุ์ใหม่นี้ เป็นสัญญาณว่าการพัฒนาแอปพลิเคชัน AI กำลังก้าวจากโหมด “การต่อยอดเครื่องมือ” สู่ยุคใหม่ของ “ระบบปฏิบัติการดั้งเดิมของ AI”
ประการแรก คือ Managed Agents ที่ Anthropic เปิดตัว มันกำหนดวิธีการโต้ตอบระหว่าง AI กับเครื่องมือใหม่ผ่านการเชื่อมต่อแบบ OAuth ด้วยคลิกเดียว การโฮสต์บนคลาวด์ การแยกตัวในแซนด์บ็อกซ์ และช่องทางการสั่งการระยะไกล ในกระบวนทัศน์นี้ AI เองคือระบบปฏิบัติการ ในขณะที่เครื่องมือต่างๆ กลายเป็น “อุปกรณ์ต่อพ่วง” ที่สามารถจัดสรรได้ สิ่งนี้สร้างแรงกระแทกเชิงสถาปัตยกรรมขั้นพื้นฐานต่อโซลูชันประเภท OpenClaw ที่ต่อยอดฟังก์ชัน AI บนระบบปฏิบัติการแบบดั้งเดิม
ประการที่สอง คือ Hermes Agent ที่เพิ่งจุดกระแสในชุมชนโอเพ่นซอร์ส เอเจนต์อัจฉริยะอิสระตัวนี้ที่เปิดตัวโดย Nous Research ได้รับดาวหลายหมื่นดวงบน GitHub อย่างรวดเร็ว โดยความเร็วในการอัปเดตนั้นเร็วกว่าผลิตภัณฑ์เชิงพาณิชย์ส่วนใหญ่ด้วยซ้ำ ข้อเสนอแนะจากผู้ใช้แสดงให้เห็นว่าความลื่นไหลของประสบการณ์ได้ทำให้หลายคนพิจารณาเปลี่ยนจากโซลูชัน OpenClaw เดิม

ในฐานะเอเจนต์อัจฉริยะที่สามารถติดตั้งบนเซิร์ฟเวอร์ส่วนตัวและทำงานอยู่ตลอดเวลา Hermes Agent มีคุณสมบัติหลักหกประการ: การทำงานอย่างต่อเนื่อง การเรียนรู้และปรับปรุงอย่างต่อเนื่อง การทำงานอัตโนมัติตามกำหนดเวลา การมอบหมายงานและการทำงานแบบขนาน สภาพแวดล้อมแซนด์บ็อกซ์ที่ปลอดภัย และความสามารถในการควบคุมเว็บและเบราว์เซอร์อย่างสมบูรณ์ ปรัชญาของ Nous Research คือการสร้างเอเจนต์อัจฉริยะที่ “เติบโตไปพร้อมกับผู้ใช้” โดยเน้นว่าเอเจนต์ควรเป็นหุ้นส่วนที่เป็นส่วนตัว ทำงานอยู่ตลอดเวลา สามารถสะสมประสบการณ์ และในที่สุดก็ส่งผลย้อนกลับไปยังการฝึกโมเดล
ไม่ว่าจะเป็นกระบวนทัศน์การโฮสต์บนคลาวด์ของ Managed Agents หรือแนวคิดการทำงานอยู่ตลอดเวลาบนเซิร์ฟเวอร์ส่วนตัวของ Hermes Agent ล้วนชี้ไปที่ข้อสรุปเดียวกัน: สถาปัตยกรรมการรวมเครื่องมือ AI ในยุคแรกซึ่งเป็นตัวแทนโดย OpenClaw อาจกำลังจะล้าสมัย ยุคที่ AI เป็นแกนกลางของระบบปฏิบัติการกำลังเริ่มต้นขึ้น
ความเจ็บปวดของ “การเลี้ยงกุ้ง”: สถาปัตยกรรมที่เปราะบางและความกังวลด้านความปลอดภัย
ในช่วงหลายเดือนที่ผ่านมา ภายใต้กระแสความนิยม “การเลี้ยงกุ้ง” ที่ใช้ OpenClaw เป็นพื้นฐาน คือราคาที่สูงที่ผู้ใช้ทั่วไปและนักพัฒนาต้องจ่ายให้กับสถาปัตยกรรมที่เปราะบาง
ตามรายงานจากหลายหน่วยงานด้านความปลอดภัยเครือข่าย มีปลั๊กอินในระบบนิเวศปลั๊กอินของ OpenClaw สัดส่วนที่ค่อนข้างสูงที่ตรวจพบว่ามีช่องโหว่ร้ายแรงหรือถูก “วางยาพิษ” อย่างมุ่งร้าย ในเหตุการณ์โจมตีที่มีชื่อว่า “ClawHavoc” ปลั๊กอินที่เป็นอันตรายจำนวนมากที่ปลอมตัวเป็นผู้ช่วยด้านออฟฟิศ สามารถสแกนและขโมยข้อมูลสำคัญในไดเรกทอรีท้องถิ่นของผู้ใช้ได้โดยตรง รวมถึงประวัติการแชท คีย์ส่วนตัวของกระเป๋าเงินอิเล็กทรอนิกส์ และรหัสผ่านของแพลตฟอร์มแลกเปลี่ยน สร้างภัยคุกคามด้านความปลอดภัยอย่างร้ายแรง

แม้จะไม่นับความเสี่ยงด้านความปลอดภัย สถาปัตยกรรมของ OpenClaw เองก็ถูกวิพากษ์วิจารณ์อย่างหนัก มันมักจะถูก “ต่อ” ขึ้นมาจากปลั๊กอินและคีย์ API ต่างๆ ถูกผู้ใช้ล้อเลียนว่าเป็น “Frankenstein” สถาปัตยกรรมเช่นนี้ไม่เพียงแต่ไม่มีประสิทธิภาพ ทำให้การใช้ Token สูงอย่างต่อเนื่อง เพิ่มต้นทุนการใช้ แต่ยังไม่เสถียรอย่างยิ่ง การอัปเดตเวอร์ชันเพียงครั้งเดียวอาจทำให้บริการล่มได้ ผู้ใช้มักต้องใช้พลังงานและเวลาในการดีบักและบำรุงรักษาเป็นจำนวนมาก ทำให้ประสบการณ์การใช้แย่
ในขณะเดียวกัน Anthropic ซึ่งเป็นหนึ่งในซัพพลายเออร์โมเดลหลักของ OpenClaw ก็ได้เข้มงวดนโยบายการสนับสนุนเอเจนต์ภายนอกผ่านโควต้าพีคเกจทางอ้อม นำผู้ใช้ไปสู่การใช้ API ทางการที่คิดค่าบริการตามการใช้งานจริง การเปลี่ยนแปลงนี้บังคับให้นักพัฒนาต้องตัดสินใจเลือกอย่างยากลำบากระหว่างต้นทุนและประสิทธิภาพ ซึ่งยิ่งบีบพื้นที่การอยู่รอดของ OpenClaw
Managed Agents: การปฏิวัติการแยกส่วนสถาปัตยกรรมอย่างสมบูรณ์
ในขณะที่ “การเลี้ยงกุ้ง” ตกอยู่ในภาวะยากลำบาก Managed Agents ที่ Anthropic เปิดตัวได้นำเสนอโซลูชันใหม่ ใจกลางของมันคือการทำ “การแยกส่วนสถาปัตยกรรม” อย่างสมบูรณ์ โดยแยกเอเจนต์อัจฉริยะออกเป็นสามองค์ประกอบมาตรฐาน ปรัชญาการออกแบบนี้เป็นการแสดงความเคารพต่อแนวคิดโมดูลาร์ของระบบปฏิบัติการ Unix:
- ชั้นเซสชัน: เป็นบันทึกที่คงอยู่แบบเพิ่มเติมเท่านั้น บันทึกประวัติการโต้ตอบทั้งหมดอย่างอิสระ เพื่อให้แน่ใจว่าความทรงจำไม่สูญหาย
- ชั้นเฟรมเวิร์ก: ประกอบด้วยตรรกะการตัดสินใจและการจัดตารางงานหลักของเอเจนต์อัจฉริยะ รับผิดชอบในการเรียกใช้โมเดลและแจกจ่ายคำสั่งไปยังเครื่องมือ
- ชั้นแซนด์บ็อกซ์: สภาพแวดล้อมการทำงานที่ปลอดภัยซึ่งแยกออกมาอย่างสมบูรณ์ โมเดลจะรันโค้ดหรือจัดการไฟล์ที่นี่

ความปฏิวัติของการออกแบบนี้อยู่ที่การเปลี่ยนโครงสร้างโทโพโลยีของการคำนวณ โมเดล (สมอง) ไม่จำเป็นต้องเชื่อมโยงอย่างแน่นหนากับสภาพแวดล้อมการทำงาน (มือ) และที่เก็บความทรงจำอีกต่อไป ชั้นเฟรมเวิร์กสามารถจัดสรรคอนเทนเนอร์แซนด์บ็อกซ์ได้เหมือนเรียกใช้เครื่องมือทั่วไป ผ่านอินเทอร์เฟซมาตรฐาน (เช่น execute(name, input))
ข้อได้เปรียบหลักที่ตามมาประกอบด้วย:
- จาก “สัตว์เลี้ยง” สู่ “ปศุสัตว์”: ในสถาปัตยกรรมแบบดั้งเดิม เซิร์ฟเวอร์ที่โฮสต์เอเจนต์อัจฉริยะเปรียบเสมือน “สัตว์เลี้ยง” ที่ดูแลยาก เปลี่ยนและจัดการได้ยาก Managed Agents ทำให้องค์ประกอบเป็นมาตรฐานและรวมเป็นกลุ่ม ทำให้กลายเป็น “ปศุสัตว์” ที่สามารถสร้าง ทำลาย และเปลี่ยนได้ตลอดเวลา เพิ่มความน่าเชื่อถือและความสามารถในการบำรุงรักษา
- ก้าวข้ามข้อจำกัดของคอนเท็กซ์: ด้วยการมองเซสชันเป็นบันทึกที่สามารถจัดเก็บภายนอก ค้นหาและสรุปตามความต้องการ แทนที่จะเป็นคอนเท็กซ์ที่ต้องโหลดทั้งหมด จึงสามารถก้าวข้ามข้อจำกัดของหน้าต่างคอนเท็กซ์ของโมเดลที่มีต่องานระยะยาวได้สำเร็จ
- บรรลุการขยายขนาดและการทำงานแบบขนาน: เนื่องจากสมองและมือถูกแยกออกจากกัน ระบบสามารถจัดสรรทรัพยากรการคำนวณแบบไดนามิกได้ จะเรียกใช้แซนด์บ็อกซ์ก็ต่อเมื่อต้องการดำเนินการเท่านั้น ซึ่งช่วยลดความล่าช้าในการตอบสนองงานได้อย่างมาก ในขณะเดียวกัน โมเดลสามารถให้เหตุผลและแจกจ่ายงานไปยังสภาพแวดล้อมการทำงานหลายๆ แห่งพร้อมกันได้
- ขจัดปัญหาความปลอดภัยเรื้อรัง: ข้อมูลสำคัญ (เช่น คีย์ API) สามารถจัดเก็บไว้ในตู้นิรภัยที่ปลอดภัยภายนอกแซนด์บ็อกซ์ เอเจนต์อัจฉริยะเริ่มการเรียกใช้ผ่านช่องทางที่ปลอดภัย โดยตัวมันเองไม่จำเป็นต้องและไม่สามารถเข้าถึงคีย์ดั้งเดิมได้ ซึ่งเป็นการแก้ปัญหาการรั่วไหลของคีย์ส่วนตัวตั้งแต่รากฐาน

การปรากฏตัวของ Managed Agents เป็นสัญญาณว่าการพัฒนาแอปพลิเคชัน AI กำลังเปลี่ยนจากการ “ปะผุ” รอบโมเดลเดียว ไปสู่การสร้างระบบปฏิบัติการรุ่นต่อไปที่มี AI เป็นแกนกลางและเครื่องมือเป็นส่วนขยาย นี่ไม่ใช่แค่การอัปเกรดเทคโนโลยี แต่เป็นการเปลี่ยนแปลง “การยกระดับมิติ” ของกระบวนทัศน์การพัฒนาและการใช้งาน
การแยกโครงสร้างเช่นนี้ ทำให้การโจมตีแบบ Prompt Injection แบบดั้งเดิมสูญเสียเป้าหมายทางกายภาพที่ชัดเจน
Hermes Agent: เอเจนต์อัจฉริยะที่มีความสามารถในการวิวัฒนาการ
หากเอเจนต์ AI ส่วนใหญ่เป็น “พนักงานชั่วคราวที่ลืมเมื่อทำงานเสร็จ” Hermes Agent ก็เหมือนกับ “พนักงานอาวุโสที่รู้จักทบทวน จดบันทึก และสามารถเติบโตอย่างต่อเนื่อง”

คุณลักษณะที่สำคัญที่สุดของมันคือการสร้างวงจรการเรียนรู้ที่สมบูรณ์โดยตรงในโครงสร้างระบบ มันสามารถจดจำประสบการณ์ สรุปประสบการณ์เป็นทักษะที่นำกลับมาใช้ใหม่ได้ และแปลงข้อมูลเส้นทางการทำงานที่เกิดขึ้นระหว่างการทำงานประจำวัน เป็นวัสดุฝึกอบรมสำหรับโมเดลรุ่นต่อไป กล่าวง่ายๆ คือ มันไม่เพียงแต่ทำงานให้สำเร็จ แต่ยังอัปเกรดตัวเองในระหว่างกระบวนการทำงาน
วงจรวิวัฒนาการนี้สามารถแบ่งออกเป็นสามระดับ:
ระดับที่หนึ่ง: ความทรงจำ
นี่คือระดับพื้นฐานของ Hermes และเป็นส่วนที่ทำให้เอเจนต์หลายตัวทำงานไม่เสถียร ระบบรักษาไฟล์ความทรงจำระยะยาวสองไฟล์สำหรับเอเจนต์: MEMORY.md และ USER.md เมื่อรวมกับความสามารถในการค้นหาข้ามเซสชันที่ใช้ FTS5 และความสามารถในการสรุปของโมเดลขนาดใหญ่ กลไกความทรงจำของมันสามารถเข้าใจได้ว่า: มันอาจไม่สามารถจำบทสนทนาทั้งหมดในอดีตได้ทุกคำ แต่สามารถค้นหาข้อมูลประวัติศาสตร์ได้อย่างมีประสิทธิภาพ และสรุปอย่างรวดเร็วเป็นคอนเท็กซ์ที่สามารถใช้ได้กับงานปัจจุบัน

นี่หมายความว่า Hermes จะไม่ตกอยู่ในสถานะ “ความจำเสื่อม” เมื่อเริ่มเซสชันใหม่ เหมือนกับเอเจนต์หลายตัว เอเจนต์ทั่วไปจะหยุดทำงานเมื่องานสิ้นสุดลง ในขณะที่ Hermes จะเริ่มกระบวนการอัปเกรดตัวเองเมื่องานสิ้นสุดลง
ระดับที่สอง: ทักษะ
ระดับนี้เป็นกุญแจสำคัญที่ทำให้ Hermes มีความแตกต่าง หลังจากทำงานที่ซับซ้อนเสร็จ มันจะทำการวิเคราะห์ย้อนหลัง แยกขั้นตอนสำคัญ บันทึกปัญหาที่พบและวิธีแก้ไข และเก็บวิธีการตรวจสอบไว้ด้วยกัน ในที่สุด มันจะห่อหุ้มระบบประสบการณ์ที่สมบูรณ์นี้เป็นไฟล์ทักษะที่มีโครงสร้าง เมื่อพบงานที่คล้ายกันอีกครั้ง มันไม่จำเป็นต้องเริ่มวางแผนตั้งแต่ต้น แต่สามารถเรียกใช้ “ชุดทักษะ” นี้เพื่อดำเนินการได้โดยตรง
ที่สำคัญกว่านั้น ทักษะเหล่านี้ไม่ใช่แบบคงที่ แต่จะได้รับการปรับปรุงอย่างต่อเนื่องตามการปฏิบัติในภายหลัง

ในขณะที่เอเจนต์อื่นๆ กำลังใช้ทรัพยากรคอนเท็กซ์ที่มีอยู่อย่างจำกัดอย่างต่อเนื่อง Hermes กลับสะสมและเพิ่มพูนคอนเท็กซ์ของมันอย่างต่อเนื่อง งานที่ผู้ใช้มอบหมายในแต่ละวัน ไม่เพียงแต่จะถูกดำเนินการอย่างมีประสิทธิภาพ แต่ยังอาจกลายเป็นส่วนหนึ่งของความสามารถของระบบ
ระดับที่สาม: ข้อมูลการฝึกอบรม
การออกแบบระดับนี้มีวิสัยทัศน์มากกว่า Hermes มีความสามารถในการสร้างเส้นทางการทำงานแบบกลุ่มในตัว และเชื่อมต่อกับสภาพแวดล้อมการเรียนรู้แบบเสริมกำลัง Atropos ข้อมูลเส้นทางการทำงานที่เกิดขึ้นระหว่างการทำงานประจำวันเหล่านี้ สามารถใช้ฝึกอบรมโมเดลรุ่นต่อไปได้โดยตรงในอนาคต

กล่าวอีกนัยหนึ่ง งานที่ Hermes จัดการในแต่ละวัน นอกจากจะแก้ปัญหาในปัจจุบันแล้ว ยังสะสมข้อมูลสำหรับวิวัฒนาการของโมเดลในอนาคตอีกด้วย ประเด็นนี้มีความสำคัญมาก เพราะมันพยายามแก้ไขจุดบกพร่องหลักของเอเจนต์หลายตัวในปัจจุบันที่ “เริ่มต้นจากศูนย์ทุกครั้งที่ทำงาน ความสามารถสะสมได้ยากและไม่เสถียร” Hermes สร้างเส้นทางวิวัฒนาการความสามารถที่สมบูรณ์ เริ่มจากงานครั้งเดียว ผ่านการจดจำ การสะสมทักษะ การกู้คืนเส้นทางการทำงาน และสุดท้ายไหลกลับสู่การฝึกอบรมโมเดล
ในทางตรงกันข้าม สถาปัตยกรรมที่พึ่งพาการเรียกใช้ปลั๊กอินหรือเปลี่ยนโมเดลพื้นฐานเท่านั้น ประสิทธิภาพและความลึกของการสะสมความสามารถดูเหมือนจะไม่เพียงพอ ในยุคของระบบปฏิบัติการดั้งเดิมของ AI การสร้างระบบความสามารถที่สามารถวิวัฒนาการอย่างยั่งยืน จะกลายเป็นกุญแจสำคัญในการรักษาขีดความสามารถในการแข่งขันในระบบนิเวศเทคโนโลยีใหม่
แหล่งอ้างอิง
– ที่อยู่โปรเจกต์ Hermes Agent: https://github.com/NousResearch/hermes-agent
– ภาพรวม Managed Agents บนแพลตฟอร์ม Claude: https://platform.claude.com/docs/zh-CN/managed-agents/overview
⚠️ หมายเหตุ: เนื้อหาได้รับการแปลโดย AI และตรวจสอบโดยมนุษย์ หากมีข้อผิดพลาดโปรดแจ้ง
☕ สนับสนุนค่ากาแฟทีมงาน
หากคุณชอบบทความนี้ สามารถสนับสนุนเราได้ผ่าน PromptPay
本文来自网络搜集,不代表คลื่นสร้างอนาคต立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/th/archives/29727
