เฮอร์มีส เอเจนต์ สตาร์ทอัพดังแห่งซิลิคอนแวลลีย์ ปังข้ามคืน: คว้าดาวบน GitHub 66,000 ดวง เชื่อมต่อ WeChat โดยตรง สร้างความตื่นตัวในแวดวงนักพัฒนา

4 days ago • คลังสินค้า AI • 58 views

Hermes Agent ที่เป็นที่นิยมใหม่ในซิลิคอนวัลเลย์ได้รับความสนใจอย่างกว้างขวางในระยะนี้ ไม่เพียงแต่ได้รับดาวจำนวนมากบน GitHub เท่านั้น ความสามารถในการเชื่อมต่อกับ WeChat แบบเนทีฟยังก่อให้เกิดการอภิปรายในชุมชนนักพัฒนาอีกด้วย เมื่อเร็วๆ นี้ งานวิจัยฉบับแรกที่ลงนามโดย Hermes ก็ได้รับการเผยแพร่แล้ว

ความนิยมของ Hermes Agent ยังคงเพิ่มขึ้นอย่างต่อเนื่อง ปัจจุบัน ปริมาณการใช้โทเค็นรายวันบนแพลตฟอร์ม OpenRouter ของมันอยู่ในอันดับที่สอง รองจาก OpenClaw ในขณะเดียวกัน แอปพลิเคชันนี้อยู่ในอันดับที่หนึ่งในรายการ “แอปพลิเคชันการเขียนโปรแกรม” ทั่วโลก และอยู่ในอันดับที่สองในรายการ “ผลิตภาพ”

| เฮอร์มีส เอเจนต์ สตาร์ทอัพดังแห่งซิลิคอนแวลลีย์ ปังข้ามคืน: คว้าดาวบน GitHub 66,000 ดวง เชื่อมต่อ WeChat โดยตรง สร้างความตื่นตัวในแวดวงนักพัฒนา

หลังจากพัฒนามา 9 เดือน โครงการนี้ได้รับดาว 66k ดาว และมีฟอร์ก 8.8k ฟอร์กบน GitHub เนื่องจากได้รับความสนใจสูง จำนวน Issues ที่ส่งเข้ามาก็สูงถึง 2.3k

เฮอร์มีส เอเจนต์ สตาร์ทอัพดังแห่งซิลิคอนแวลลีย์ ปังข้ามคืน: คว้าดาวบน GitHub 66,000 ดวง เชื่อมต่อ WeChat โดยตรง สร้างความตื่นตัวในแวดวงนักพัฒนา

ที่อยู่โครงการ: https://github.com/nousresearch/hermes-agent

การเชื่อมต่อแบบเนทีฟกับ WeChat

ด้วยคุณสมบัติของ “เอเจนต์อัจฉริยะที่เติบโตด้วยตนเอง” Hermes Agent ได้รับความนิยมจากนักพัฒนาจำนวนไม่น้อย Garry Tan ซีอีโอของ YC หลังจากทดลองใช้ด้วยตนเองแล้ว ระบุว่าได้เปลี่ยนมาใช้เครื่องมือนี้แล้ว

เมื่อเร็วๆ นี้ Nous Research ประกาศว่า Hermes ได้รองรับการเชื่อมต่อ “แบบเนทีฟ” กับ WeChat แล้ว ฟังก์ชันนี้ทำงานบนเซิร์ฟเวอร์สาธารณะ ไม่จำเป็นต้องกำหนดค่า Webhook สามารถล็อกอินได้โดยการสแกนคิวอาร์โค้ด

เอกสารทางการ: https://hermes-agent.nousresearch.com/docs/user-guide/messaging/weixin

หลังจากฟังก์ชันนี้เปิดตัว บัญชีทางการของ Nous Research ได้โพสต์ทวีตภาษาจีนที่เกี่ยวข้อง ซึ่งได้รับยอดวิวและปฏิสัมพันธ์ที่ค่อนข้างสูง

น่าสนใจที่ Nous Research ระบุว่า เนื้อหาของทวีตภาษาจีนนี้ได้รับการขัดเกลาโดย Hermes

ในด้านการนำไปใช้ทางเทคนิค ฟังก์ชันนี้ใช้ iLink Bot API ทางการของ Tencent ไม่ได้ใช้โปรโตคอลของบุคคลที่สามที่ถูกแคร็กหรือไคลเอนต์ที่ไม่เป็นทางการ อย่างไรก็ตาม แนะนำให้ผู้ใช้ทดสอบด้วยบัญชีสำรองก่อน

นอกจากนี้ Hermes ยังรองรับการเชื่อมต่อกับเครื่องมือสื่อสารทันทีหลักอื่นๆ ในประเทศจีน เช่น DingTalk, Feishu, WeChat Work เป็นต้น ผู้ใช้สามารถเลือกใช้ตามเวิร์กโฟลว์ของตนเองได้

ขั้นตอนการกำหนดค่าการเชื่อมต่อ WeChat มีดังนี้:

1. ติดตั้ง dependencies
แพ็คเกจหลักสองตัวขาดไม่ได้:
* pip install aiohttp cryptography
หากต้องการแสดงคิวอาร์โค้ดในเทอร์มินัลโดยตรง สามารถติดตั้งเพิ่มเติมได้:
* pip install qrcode

2. ล็อกอินด้วยการสแกนคิวอาร์โค้ด
รันคำสั่งต่อไปนี้เพื่อเริ่มต้นตัวช่วยตั้งค่า:
* hermes gateway setup
เลือกตัวเลือก “Weixin” ตัวช่วยตั้งค่าจะสร้างคิวอาร์โค้ดโดยอัตโนมัติ (หรือแสดงลิงก์ในเทอร์มินัล) รอให้ผู้ใช้สแกนคิวอาร์โค้ดด้วย WeChat บนมือถือและยืนยันการล็อกอิน หลังจากล็อกอินสำเร็จ ข้อมูลประจำตัวบัญชีจะถูกบันทึกไว้ในไดเรกทอรี ~/.hermes/weixin/accounts/ และเทอร์มินัลจะแสดงข้อความ “เชื่อมต่อ WeChat สำเร็จ” พร้อมกับ account_id ที่เกี่ยวข้อง

3. กำหนดค่าตัวแปรสภาพแวดล้อม
แก้ไขไฟล์ ~/.hermes/.env อย่างน้อยต้องกำหนดค่า:
* WEIXIN_ACCOUNT_ID=your-account-id
หากต้องการจำกัดผู้ใช้ที่สามารถส่งข้อความถึง Bot ได้ สามารถเพิ่ม:
* WEIXIN_DM_POLICY=allowlist
* WEIXIN_ALLOWED_USERS=user_id_1,user_id_2
ข้อความกลุ่มถูกปิดโดยค่าเริ่มต้น หากต้องการเปิดใช้งานในกลุ่มเฉพาะ ต้องตั้งค่าบัญชีรายชื่อที่อนุญาตด้วยตนเอง:
* WEIXIN_GROUP_POLICY=allowlist
* WEIXIN_GROUP_ALLOWED_USERS=group_id_1
หากต้องการส่งงานที่กำหนดเวลา หรือการแจ้งเตือนไปยังหน้าต่างแชทที่กำหนด สามารถกำหนดค่า:
* WEIXIN_HOME_CHANNEL=chat_id
* WEIXIN_HOME_CHANNEL_NAME=Home

4. เริ่มต้นบริการ
รันคำสั่งต่อไปนี้เพื่อเริ่มต้นบริการเกตเวย์:
* hermes gateway
อะแดปเตอร์จะใช้ข้อมูลประจำตัวที่บันทึกไว้เพื่อเชื่อมต่อกับ iLink และเริ่มต้นการลองพอลลิง ณ จุดนี้ เมื่อส่งข้อความถึง Bot โดยปกติจะได้รับคำตอบภายในไม่กี่วินาที

ปัญหาที่ทราบและแนวทางแก้ไข:
* การแบ่งข้อความ: เนื่องจากข้อความเดียวใน WeChat มีขีดจำกัดโทเค็น (ประมาณ 4000) คำตอบที่ยาวจะถูกตัดแบ่งและส่งโดยอัตโนมัติ ซึ่งอาจส่งผลต่อความต่อเนื่องในการอ่าน
* เซสชันหมดอายุ: หากพบข้อผิดพลาดรหัส -14 โดยทั่วไปหมายความว่าเซสชันหมดอายุ จำเป็นต้องรัน hermes gateway setup อีกครั้งเพื่อล็อกอินด้วยการสแกนคิวอาร์โค้ด
* โทเค็นถูกใช้งาน: หากมีข้อความแจ้งว่า “Another local Hermes gateway is already using this Weixin token” แสดงว่าโทเค็นเดียวกันนี้กำลังถูกใช้โดยอินสแตนซ์เกตเวย์อื่น จำเป็นต้องหยุดอินสแตนซ์ที่ขัดแย้งกัน
* การรับส่งไฟล์สื่อล้มเหลว: โปรดตรวจสอบให้แน่ใจว่าได้ติดตั้งไลบรารี cryptography แล้ว ไลบรารีนี้ใช้สำหรับจัดการการเข้ารหัส AES-128-ECB ของ CDN ของ WeChat

ประสิทธิภาพและการประเมิน

นักพัฒนาบางส่วนได้ทำการทดสอบเปรียบเทียบระหว่าง Hermes Agent และ OpenClaw โดยรวมแล้วความคิดเห็นเห็นว่า Hermes มีประสิทธิภาพที่ดีในด้านประสบการณ์การใช้งานที่พร้อมใช้ทันที

นักพัฒนาชาวจีนบางส่วนหลังจากได้ทดลองใช้แล้ว คิดว่า Hermes Agent สะท้อนแนวคิดของ “วิวัฒนาการด้วยตนเอง” ได้ค่อนข้างดี

เผยแพร่งานวิจัยฉบับแรกที่ลงนาม

เมื่อเร็วๆ นี้ งานวิจัยฉบับแรกที่ลงนามโดย Hermes ได้รับการเผยแพร่ งานวิจัยนี้เสนอวิธีการให้เหตุผลใหม่ที่เรียกว่า “Autoreason” ซึ่งได้รับแรงบันดาลใจจาก AutoResearch ของ Karpathy

งานวิจัยนี้กล่าวถึงปรากฏการณ์ทั่วไปในการใช้โมเดลขนาดใหญ่: ผู้คนมักมีแนวโน้มที่จะให้โมเดลแก้ไขผลลัพธ์หลายครั้ง เพื่อหวังว่าจะได้ผลลัพธ์ที่ดีขึ้น

อย่างไรก็ตาม การวิจัยของ Hermes ได้มุมมองใหม่ให้กับ “ความยึดติด” นี้ การทดลองแสดงให้เห็นว่าวิธีการ “การปรับปรุงตนเอง” (Self-Refinement) แบบดั้งเดิมมักนำไปสู่คุณภาพผลลัพธ์ที่ลดลง

งานวิจัยที่เกี่ยวข้องชี้ให้เห็นว่า ไม่ว่าคำสั่งจะออกแบบมาอย่างดีเพียงใด วงจร “วิจารณ์-แก้ไข” แบบดั้งเดิมมักมีข้อบกพร่องหลักสามประการ:

ข้อบกพร่องจากภาพลวงตา: เพื่อตอบสนองต่อคำสั่งวิจารณ์ โมเดลอาจสร้างข้อบกพร่องที่ไม่มีอยู่เดิมขึ้นมา
การขยายตัวที่ควบคุมไม่ได้: แต่ละรอบของการวนซ้ำอาจทำให้เนื้อหาขยายตัวโดยไม่มีขอบเขต และเบี่ยงเบนจากเจตนาเดิม
การปฏิเสธที่ไร้ความสามารถ: แม้ว่าผลลัพธ์เริ่มต้นจะดีเพียงพอแล้ว โมเดลก็แทบจะไม่เคยปฏิเสธคำแนะนำในการแก้ไขเลย นำไปสู่การปรับปรุงที่มากเกินไปและการลดลงของประสิทธิภาพ

ตรรกะหลักของวิธีการ Autoreason ละทิ้งการแก้ไขแบบวนซ้ำอย่างมืดบอด และหันมาใช้กลไกการแข่งขันและการบรรจบกันที่เข้มงวดแทน

แต่ละรอบของการวนซ้ำถูกออกแบบให้เป็น “การแข่งขันแบบทัวร์นาเมนต์สามฝ่าย”: ผู้เข้าแข่งขัน A (รักษาสภาพปัจจุบัน), ผู้เข้าแข่งขัน B (แก้ไขแบบต่อต้าน), ผู้เข้าแข่งขัน AB (สังเคราะห์ข้อได้เปรียบ) ผู้สมัครทั้งสามเวอร์ชันนี้จะถูกประเมินโดยกลุ่ม “เอเจนต์ผู้ประเมินแบบบอด” และใช้ วิธีการนับคะแนน Borda ในการลงคะแนน

Autoreason ได้แนะนำตรรกะการหยุดที่สำคัญ: หาก “การรักษาสภาพปัจจุบัน (ผู้เข้าแข่งขัน A)” ชนะติดต่อกันสองครั้ง ระบบจะหยุดการวนซ้ำทันที กลไกนี้รับประกันความเสถียรของผลลัพธ์ – การวนซ้ำจะดำเนินต่อไปก็ต่อเมื่อการแก้ไขได้รับการพิสูจน์แล้วว่าสามารถสร้างคุณค่าได้อย่างชัดเจน; เมื่อโมเดลไม่สามารถมีส่วนร่วมที่สร้างสรรค์ได้ มันจะหยุดโดยอัตโนมัติ

ผลงานที่ย้อนกลับของโมเดลขนาดเล็ก

ในงานเขียนที่ซับซ้อนห้าประเภท ซึ่งครอบคลุมกลยุทธ์ การออกแบบระบบ การกำหนดนโยบาย การวิเคราะห์การแข่งขัน และการตอบสนองต่ออุบัติเหตุ Autoreason แสดงให้เห็นถึงข้อได้เปรียบที่โดดเด่น

การใช้โมเดล Haiku 3.5 ที่มีต้นทุนเพียงหนึ่งในสิบของ Sonnet ร่วมกับวิธีการ Autoreason คุณภาพผลลัพธ์สามารถเทียบเท่ากับผลลัพธ์จากการสร้างครั้งเดียวของ Sonnet 4 ในการจำลองแบบมอนติคาร์โล งานทั้งสามได้รับคะแนนเต็ม 42/42

การทดลองเปรียบเทียบเน้นย้ำถึงคุณค่าของมัน: หลังจากผ่านการปรับปรุงตนเองแบบดั้งเดิม 15 รอบ โมเดลไม่สามารถแยกแยะระหว่าง “การปรับปรุง” และ “การทำลาย” ได้ ลดบทความที่มีความยาว 345 คำ เหลือเพียง 102 คำ (สูญเสียเนื้อหา 70%) ส่งผลให้เนื้อหาพังทลาย ในขณะที่ผลลัพธ์ของ Autoreason ยังคงมีแนวโน้มเติบโตอย่างต่อเนื่อง กลไกการประเมินของมันสามารถสกัดกั้นสถานการณ์ “ยิ่งแก้ยิ่งแย่” ได้อย่างมีประสิทธิภาพ

ในการทดสอบงานเขียนห้าประเภทโดยใช้โมเดล Sonnet 4 คะแนน Borda เฉลี่ยของ Autoreason อยู่ที่ 27.8 คะแนน และผลงานที่แย่ที่สุดก็ไม่ตกลงไปอยู่นอกสองอันดับแรก ข้อได้เปรียบของมันเด่นชัดเป็นพิเศษในงานที่ต้องมีการแลกเปลี่ยนและการตัดสินใจเชิงสาระสำคัญ

นอกจากนี้ ในการทดสอบแก้ปัญหาการเขียนโปรแกรม 150 ข้อ อัตราการกู้คืนจากความล้มเหลวของ Autoreason อยู่ที่ 62% ซึ่งสูงกว่าอัตราความสำเร็จจากการสร้างครั้งเดียวที่ 43% อย่างมาก ขั้นตอนการวิเคราะห์ที่มีโครงสร้างบังคับของมัน ทำให้โมเดลต้องคิดอย่างลึกซึ้งถึงสาเหตุของความล้มเหลวก่อนที่จะพยายามแก้ไข