Chrome 146 版本引入了一项关键更新:原生支持模型上下文协议(MCP)。这一特性将显著改变 AI Agent 与浏览器交互的方式。
以往,通过 AI 操作浏览器通常面临两种选择:使用无头模式,或手动移植登录状态。这两种方法都存在局限——无头浏览器易被网站检测并限制;而移植 Cookie、Token 等登录凭证则过程繁琐。尽管存在通过中继插件调用浏览器功能的解决方案,但其稳定性和易用性往往不佳。
此次更新带来了根本性的改变。Chrome 146 内置了 MCP 支持,用户只需在 chrome://inspect 页面中启用远程调试开关(chrome://inspect/#remote-debugging),即可授权 AI Agent 直接控制当前正在运行的浏览器会话,而无需启动新实例。
开发者 Petr Baudis 演示了一个实际用例:他指示 Claude AI 帮助清理 LinkedIn 上收到的推销类连接请求。Claude 直接操作他已登录的浏览器会话,访问 LinkedIn 页面,分析每个邀请,并执行了批量忽略操作。整个过程完全复用现有登录状态,无需额外认证。

这项更新的核心意义在于:
- 会话免重登:AI Agent 可直接复用用户日常使用的现有登录状态。
- 规避检测风险:操作基于真实的用户浏览器环境,而非自动化工具,有效避免了反机器人指纹检测。
- 拓展自动化场景:诸如自动填写复杂表单、操作政府门户网站、测试需要登录的 Web 应用等以往难以实现的任务,其技术门槛被大幅降低。
当然,这项能力也带来了新的挑战,尤其是控制权与安全边界问题。让 AI Agent 操作真实浏览器会话,必须建立清晰的权限管控和操作审计机制,以防范潜在风险。
目前,官方的 Chrome MCP 客户端在处理数百个标签页时可能不够稳定。为此,Petr Baudis 开发了一个优化技能 chrome-cdp-skill。安装方式如下:bash
npx skills add https://github.com/pasky/chrome-cdp-skill
此外,用户也可直接在 chrome://inspect 中开启调试开关来使用基础功能。据悉,OpenClaw 等平台也将在新版本中集成此支持,未来执行浏览器操作任务的 Token 消耗有望进一步降低。
浏览器操作是 LLM 最重要的能力扩展之一,Chrome 原生集成 MCP 将为众多现有的自动化工作流带来便利。
关注“鲸栖”小程序,掌握最新AI资讯
本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/archives/25632
