ความก้าวหน้าใหม่ของเครื่องมือ AI: เครื่องมือเชื่อมต่ออินเทอร์เน็ต Claude, เบราว์เซอร์ Zig เร็วขึ้น 11 เท่า, แพ็กเกจฟรีทั้งชุด, เบราว์เซอร์ของคุณคือ API!
01 มอบความสามารถเชื่อมต่ออินเทอร์เน็ตแบบเต็มรูปแบบให้กับ Claude Code
ผู้ใช้ Claude Code ในช่วงนี้อาจสังเกตว่าฟังก์ชันการค้นหาเว็บมักใช้งานไม่ได้ บางครั้งมันพึ่งพาเครื่องมือค้นหามากเกินไปจนละเลยเนื้อหาเว็บ หรือบางครั้งก็หยุดทำงานทันทีเมื่อเจอเว็บไซต์ที่ต้องล็อกอิน
นักพัฒนารายหนึ่งได้เปิดซอร์ส Skill ชื่อ Web Access เมื่อ 6 วันที่ผ่านมา และตอนนี้มี Star เกือบ 1,000 ดวงแล้ว ฟังก์ชันหลักของมันคือการมอบความสามารถเบราว์เซอร์แบบเต็มรูปแบบให้กับ Claude Code

การออกแบบ Web Access ค่อนข้างชาญฉลาด:
* ล็อกอินแบบไร้รอยต่อ: เชื่อมต่อโดยตรงกับเบราว์เซอร์ Chrome ที่ผู้ใช้ใช้งานประจำผ่านโปรโตคอล CDP AI สามารถใช้สถานะบัญชีที่ผู้ใช้ล็อกอินไว้ในเว็บไซต์ต่างๆ ได้โดยตรง โดยไม่ต้องล็อกอินซ้ำ
* ตรรกะการท่องเว็บที่เหมือนมนุษย์: ออกแบบปรัชญาการท่องเว็บชุดหนึ่ง เพื่อชี้นำให้ AI คิดถึงกระบวนการใช้อินเทอร์เน็ตเหมือนมนุษย์: กำหนดเป้าหมายให้ชัดเจนก่อน จากนั้นเลือกวิธีที่ดีที่สุด ตรวจสอบทิศทางอย่างต่อเนื่องระหว่างกระบวนการ และสุดท้ายตัดสินว่าการทำงานเสร็จสิ้นหรือไม่

- ความสามารถในการประมวลผลแบบขนาน: รองรับการแบ่งงานย่อยให้ Agent ย่อยทำงานแบบขนาน ตัวอย่างเช่น เมื่อต้องการให้สำรวจเว็บไซต์ทางการของผลิตภัณฑ์ 5 รายการพร้อมกัน มันจะเปิด Agent ย่อยหลายตัวเพื่อประมวลผลแบบขนาน โดยแต่ละ Agent ย่อยใช้แท็บเบราว์เซอร์แยกกัน ซึ่งมีประสิทธิภาพสูงกว่าการประมวลผลแบบเรียงลำดับมาก
ขั้นตอนการติดตั้งง่ายดาย ใช้เพียงคำสั่งเดียว หลังการติดตั้ง ผู้ใช้สามารถสั่ง Claude Code โดยตรงว่า “ค้นหา xxx” หรือ “ไปดูที่ Xiaohongshu” AI จะตัดสินใจและดำเนินการตามนั้นโดยอัตโนมัติ
- ที่อยู่ซอร์สโค้ด:
https://github.com/eze-is/web-access
02 สร้างเบราว์เซอร์จากศูนย์โดยใช้ภาษา Zig
หาก AI Agent เป็นรูปแบบหลักของแอปพลิเคชันรุ่นต่อไป เบราว์เซอร์ก็คือประตูทางเข้าสู่โลกแห่งความเป็นจริงที่สำคัญที่สุดสำหรับ Agent อย่างไรก็ตาม เบราว์เซอร์ Chrome มีขนาดใหญ่และซับซ้อนเกินไป
Lightpanda เป็นเบราว์เซอร์แบบไม่มีส่วนแสดงผล (headless browser) แบบโอเพ่นซอร์สที่สร้างขึ้นจากศูนย์โดยสมบูรณ์ เขียนด้วยภาษา Zig ปัจจุบันมี Star มากกว่า 24,000 ดวงแล้ว

สิ่งที่น่าสังเกตคือ มันไม่ใช่ฟอร์กของ Chromium หรือแพตช์ของ WebKit แต่เป็นเบราว์เซอร์ที่เขียนขึ้นใหม่โดยเฉพาะสำหรับการใช้งานโดยเครื่องจักร
ข้อมูลประสิทธิภาพของมันน่าประทับใจ:
* ในงานดึงข้อมูลหน้าเว็บแบบขนาน 100 งาน Chrome ใช้เวลา 25.2 วินาที ในขณะที่ Lightpanda ใช้เวลาเพียง 2.3 วินาที เพิ่มความเร็วขึ้น 11 เท่า
* การใช้หน่วยความจำต่างกันมากกว่า: ภายใต้งานแบบขนาน 100 งาน Chrome ต้องการหน่วยความจำ 4.2GB ในขณะที่ Lightpanda ต้องการเพียง 696MB สิ่งนี้เป็นผลมาจากการที่สถาปัตยกรรมของมันได้ลบโค้ดการเรนเดอร์กราฟิกทั้งหมดออกไปอย่างสิ้นเชิง เนื่องจากเบราว์เซอร์สำหรับเครื่องจักรไม่จำเป็นต้องเรนเดอร์อินเทอร์เฟซ

- ความเข้ากันได้: มีเครื่องยนต์ V8 ในตัว เข้ากันได้กับ Chrome DevTools Protocol โค้ดที่เขียนด้วย Playwright หรือ Puppeteer สามารถทำงานได้โดยไม่ต้องแก้ไข
- การผสานรวม AI แบบเนทีฟ: มี MCP Server ในตัวแบบเนทีฟ AI Agent สามารถควบคุมเบราว์เซอร์ผ่านโปรโตคอล MCP โดยตรงได้ โดยไม่ต้องสร้างสะพานเชื่อมเพิ่มเติม
ปัจจุบันโปรเจกต์นี้ยังอยู่ในช่วง Beta ขอบเขตการครอบคลุม Web API กำลังได้รับการปรับปรุงอย่างต่อเนื่อง แต่งานดึงข้อมูลหน้าเว็บและงานอัตโนมัติง่ายๆ สามารถนำไปใช้งานจริงได้แล้ว
- ที่อยู่ซอร์สโค้ด:
https://github.com/lightpanda-io/browser
03 โปรเจกต์เดียวรวมบริการ AI หลายแพลตฟอร์ม
ต้นทุนการใช้บริการ AI เป็นจุดที่เจ็บปวดเสมอมา แพลตฟอร์มต่างๆ เช่น ChatGPT, Claude, Gemini, DeepSeek ต่างต้องจ่ายเงินทั้งสิ้น
OpenClaw Zero Token เป็นเวอร์ชันฟอร์กหนึ่งที่อิงจาก OpenClaw ได้รับ Star มากกว่า 2,800 ดวงภายในเวลาไม่ถึงหนึ่งเดือน มันใช้เทคโนโลยีการทำให้เบราว์เซอร์ทำงานอัตโนมัติ เพื่อจำลองสถานะการล็อกอินของผู้ใช้บนฝั่งเว็บ และเรียกใช้ Web Interface ของแต่ละแพลตฟอร์มโดยตรง จึงหลีกเลี่ยงกลไก API ที่ต้องจ่ายเงินได้
ปัจจุบันรองรับแพลตฟอร์ม AI 12 แห่ง เช่น ChatGPT, Claude, Gemini เป็นต้น
ฟังก์ชัน AskOnce ของมันใช้งานได้จริงเป็นพิเศษ: คำถามเดียวสามารถส่งไปยังโมเดลหลายตัวพร้อมกันได้ ผู้ใช้สามารถเปรียบเทียบคำตอบจากแต่ละเจ้าและเลือกคำตอบที่ดีที่สุด
โปรเจกต์ยังให้ Gateway API ที่เข้ากันได้กับ OpenAI ด้วย ซึ่งสามารถเชื่อมต่อกับไคลเอนต์ของบุคคลที่สาม เช่น ChatGPT-Next-Web, LobeChat ได้ โดยประสบการณ์การใช้งานแทบไม่แตกต่างจากการเรียกใช้ API ปกติ

สิ่งที่ต้องระวัง:
1. แนวทางนี้โดยพื้นฐานแล้วคือการหลีกเลี่ยงกลไกการชำระเงินของแพลตฟอร์ม มีความน่าสงสัยในด้านความถูกต้องตามกฎระเบียบ ก่อนใช้ควรประเมินความเสี่ยงด้วยตนเอง
2. มีนักวิจัยด้านความปลอดภัยเปิดเผยว่าโปรเจกต์ต้นทาง OpenClaw มีช่องโหว่ CVE 8 รายการ โดยรุนแรงที่สุดได้คะแนน 8.8 คะแนน หากจะนำไปติดตั้งใช้งาน ต้องระมัดระวังด้านความปลอดภัยเป็นพิเศษ
- ที่อยู่ซอร์สโค้ด:
https://github.com/linuxhsj/openclaw-zero-token
04 ทำให้เบราว์เซอร์ของคุณกลายเป็น API
การเขียนสคริปต์ดึงข้อมูล (crawler) มักประสบปัญหาเรื่องการตรวจจับป้องกันการดึงข้อมูลและการบำรุงรักษาสถานะการล็อกอิน นักพัฒนารายหนึ่งเปลี่ยนแนวคิด: เนื่องจากหลีกเลี่ยงได้ยาก ก็ใช้เบราว์เซอร์ของคุณเองโดยตรงเลย
แนวคิดหลักของ bb-browser คือ: เบราว์เซอร์ของคุณคือ API
มันใช้การผสมผสานระหว่างส่วนขยาย Chrome, CLI และ MCP Server เพื่อเปลี่ยนเบราว์เซอร์จริงที่ผู้ใช้ล็อกอินอยู่ให้กลายเป็นอินเทอร์เฟซการทำงานสำหรับ AI Agent โดยตรง

- คำสั่งที่กำหนดไว้ล่วงหน้าอย่างหลากหลาย: ครอบคลุม 36 แพลตฟอร์ม รวมถึงคำสั่งจากชุมชน 103 คำสั่ง ครอบคลุมหลายด้าน เช่น การค้นหา โซเชียลมีเดีย ข่าว วิดีโอ การเงิน เป็นต้น ตัวอย่างเช่น ให้ AI ดูรายการยอดนิยมของ Zhihu ค้นหาวิดีโอ Bilibili หรือดูโปรเจกต์ GitHub ล้วนมีอะแดปเตอร์ที่พร้อมใช้งานแล้ว
- ระบบอะแดปเตอร์ที่ขยายได้: ในระบบ Site Adapter ของมัน แต่ละคำสั่งสอดคล้องกับไฟล์ JS หนึ่งไฟล์ หากเว็บไซต์ที่ใช้บ่อยไม่อยู่ในรายการที่รองรับ การเขียนอะแดปเตอร์ด้วยตนเองมักใช้เวลาเพียงไม่กี่นาที
- วิธีการเชื่อมต่อที่ยืดหยุ่น: รองรับสามโหมด: CLI แบบสแตนด์อโลน เชื่อมต่อผ่าน MCP Server ไปยัง Claude Code หรือ Cursor และโหมดที่ไม่มีส่วนขยายซึ่งทำงานโดยตรงผ่าน OpenClaw
หากคุณรู้สึกว่าการเชื่อมต่ออินเทอร์เน็ตให้กับ Agent นั้นยุ่งยากเกินไป ประสบการณ์ใช้งานที่พร้อมใช้ทันทีของ bb-browser อาจทำให้คุณประหลาดใจได้
- ที่อยู่ซอร์สโค้ด:
https://github.com/epiral/bb-browser
⚠️ หมายเหตุ: เนื้อหาได้รับการแปลโดย AI และตรวจสอบโดยมนุษย์ หากมีข้อผิดพลาดโปรดแจ้ง
☕ สนับสนุนค่ากาแฟทีมงาน
หากคุณชอบบทความนี้ สามารถสนับสนุนเราได้ผ่าน PromptPay
本文来自网络搜集,不代表คลื่นสร้างอนาคต立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/th/archives/27701
