Chrome 146 อัปเดตครั้งใหญ่: รองรับ MCP แบบเนทีฟ ช่วยให้ AI Agent ควบคุมเซสชันเบราว์เซอร์จริงได้โดยตรง ลดความซับซ้อนในการทำงานอัตโนมัติอย่างมาก

Chrome เวอร์ชัน 146 ได้เปิดตัวอัปเดตสำคัญ: การรองรับโปรโตคอลบริบทโมเดล (MCP) แบบเนทีฟในตัว คุณลักษณะนี้จะเปลี่ยนแปลงวิธีการโต้ตอบระหว่าง AI Agent กับเบราว์เซอร์อย่างมีนัยสำคัญ

ในอดีต การควบคุมเบราว์เซอร์ผ่าน AI มักมีสองทางเลือก: การใช้โหมดเฮดเลส (headless) หรือการย้ายสถานะการเข้าสู่ระบบด้วยตนเอง ทั้งสองวิธีมีข้อจำกัด – เบราว์เซอร์เฮดเลสถูกตรวจจับและจำกัดโดยเว็บไซต์ได้ง่าย ในขณะที่กระบวนการย้ายข้อมูลเข้าสู่ระบบ เช่น คุกกี้ โทเค็น นั้นยุ่งยาก แม้จะมีโซลูชันที่ใช้ปลั๊กอินรีเลย์เพื่อเรียกใช้ฟังก์ชันเบราว์เซอร์ แต่ความเสถียรและความสะดวกในการใช้งานมักไม่ดีนัก

อัปเดตครั้งนี้ได้นำการเปลี่ยนแปลงขั้นพื้นฐานมาให้ Chrome 146 มีการรองรับ MCP ในตัว ผู้ใช้เพียงแค่เปิดสวิตช์ดีบั๊กระยะไกลในหน้า chrome://inspect (chrome://inspect/#remote-debugging) เพื่ออนุญาตให้ AI Agent ควบคุมเซสชันเบราว์เซอร์ที่กำลังทำงานอยู่ โดยตรงได้ โดยไม่จำเป็นต้องเริ่มอินสแตนซ์ใหม่

นักพัฒนา Petr Baudis ได้สาธิตกรณีการใช้งานจริง: เขาสั่งให้ Claude AI ช่วยล้างคำขอเชื่อมต่อประเภทการขายที่ได้รับบน LinkedIn Claude ควบคุมเซสชันเบราว์เซอร์ที่เขาเข้าสู่ระบบอยู่แล้วโดยตรง เข้าถึงหน้า LinkedIn วิเคราะห์คำเชิญแต่ละรายการ และดำเนินการปฏิเสธแบบกลุ่ม ทั้งกระบวนการใช้สถานะการเข้าสู่ระบบที่มีอยู่ได้เต็มที่โดยไม่ต้องรับรองความถูกต้องเพิ่มเติม

Chrome 146 อัปเดตครั้งใหญ่: รองรับ MCP แบบเนทีฟ ช่วยให้ AI Agent ควบคุมเซสชันเบราว์เซอร์จริงได้โดยตรง ลดความซับซ้อนในการทำงานอัตโนมัติอย่างมาก Chrome 146 อัปเดตครั้งใหญ่: รองรับ MCP แบบเนทีฟ ช่วยให้ AI Agent ควบคุมเซสชันเบราว์เซอร์จริงได้โดยตรง ลดความซับซ้อนในการทำงานอัตโนมัติอย่างมาก

ความสำคัญหลักของการอัปเดตนี้คือ:

  1. ไม่ต้องเข้าสู่ระบบใหม่ในเซสชัน: AI Agent สามารถใช้สถานะการเข้าสู่ระบบที่มีอยู่ซึ่งผู้ใช้ใช้งานในชีวิตประจำวันได้โดยตรง
  2. หลีกเลี่ยงความเสี่ยงจากการตรวจจับ: การดำเนินการอยู่บนสภาพแวดล้อมเบราว์เซอร์ผู้ใช้จริง ไม่ใช่เครื่องมืออัตโนมัติ ซึ่งหลีกเลี่ยงการตรวจจับลายนิ้วมือของบอต (anti-bot fingerprinting) ได้อย่างมีประสิทธิภาพ
  3. ขยายขอบเขตการทำงานอัตโนมัติ: งานที่ทำได้ยากในอดีต เช่น การกรอกแบบฟอร์มที่ซับซ้อนอัตโนมัติ การดำเนินการบนเว็บไซต์ภาครัฐ การทดสอบเว็บแอปพลิเคชันที่ต้องเข้าสู่ระบบ มีความซับซ้อนทางเทคนิคลดลงอย่างมาก

แน่นอนว่าความสามารถนี้ก็นำมาซึ่งความท้าทายใหม่ โดยเฉพาะปัญหาเรื่องการควบคุมและขอบเขตความปลอดภัย การให้ AI Agent ควบคุมเซสชันเบราว์เซอร์จริง จำเป็นต้องมีกลไกการควบคุมสิทธิ์และการตรวจสอบการดำเนินการที่ชัดเจน เพื่อป้องกันความเสี่ยงที่อาจเกิดขึ้น

ปัจจุบัน ไคลเอนต์ Chrome MCP อย่างเป็นทางการอาจไม่เสถียรเพียงพอเมื่อจัดการกับแท็บหลายร้อยแท็บ ด้วยเหตุนี้ Petr Baudis จึงได้พัฒนาสกิลที่ปรับปรุงแล้วชื่อ chrome-cdp-skill วิธีการติดตั้งมีดังนี้:
bash
npx skills add https://github.com/pasky/chrome-cdp-skill

นอกจากนี้ ผู้ใช้ยังสามารถเปิดสวิตช์ดีบั๊กใน chrome://inspect โดยตรงเพื่อใช้ฟังก์ชันพื้นฐานได้ ได้รับรายงานว่าแพลตฟอร์มอย่าง OpenClaw จะรวมการรองรับนี้ในเวอร์ชันใหม่ด้วย และคาดว่าการใช้โทเค็นสำหรับงานดำเนินการเบราว์เซอร์ในอนาคตจะลดลงอีก

การดำเนินการเบราว์เซอร์เป็นหนึ่งในการขยายขีดความสามารถที่สำคัญที่สุดของ LLM การที่ Chrome รวม MCP แบบเนทีฟจะนำความสะดวกมาสู่เวิร์กโฟลว์อัตโนมัติที่มีอยู่มากมาย


⚠️ หมายเหตุ: เนื้อหาได้รับการแปลโดย AI และตรวจสอบโดยมนุษย์ หากมีข้อผิดพลาดโปรดแจ้ง

本文来自网络搜集,不代表คลื่นสร้างอนาคต立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/th/archives/25633

Like (0)
Previous 7 hours ago
Next 2026年2月5日 am11:47

相关推荐