Chrome 146重磅更新:原生MCP支持让AI Agent直接操控真实浏览器会话,自动化门槛大幅降低

Chrome 146 版本引入了一项关键更新:原生支持模型上下文协议(MCP)。这一特性将显著改变 AI Agent 与浏览器交互的方式。

以往,通过 AI 操作浏览器通常面临两种选择:使用无头模式,或手动移植登录状态。这两种方法都存在局限——无头浏览器易被网站检测并限制;而移植 Cookie、Token 等登录凭证则过程繁琐。尽管存在通过中继插件调用浏览器功能的解决方案,但其稳定性和易用性往往不佳。

此次更新带来了根本性的改变。Chrome 146 内置了 MCP 支持,用户只需在 chrome://inspect 页面中启用远程调试开关(chrome://inspect/#remote-debugging),即可授权 AI Agent 直接控制当前正在运行的浏览器会话,而无需启动新实例。

开发者 Petr Baudis 演示了一个实际用例:他指示 Claude AI 帮助清理 LinkedIn 上收到的推销类连接请求。Claude 直接操作他已登录的浏览器会话,访问 LinkedIn 页面,分析每个邀请,并执行了批量忽略操作。整个过程完全复用现有登录状态,无需额外认证。

Chrome 146重磅更新:原生MCP支持让AI Agent直接操控真实浏览器会话,自动化门槛大幅降低 Chrome 146重磅更新:原生MCP支持让AI Agent直接操控真实浏览器会话,自动化门槛大幅降低

这项更新的核心意义在于:

  1. 会话免重登:AI Agent 可直接复用用户日常使用的现有登录状态。
  2. 规避检测风险:操作基于真实的用户浏览器环境,而非自动化工具,有效避免了反机器人指纹检测。
  3. 拓展自动化场景:诸如自动填写复杂表单、操作政府门户网站、测试需要登录的 Web 应用等以往难以实现的任务,其技术门槛被大幅降低。

当然,这项能力也带来了新的挑战,尤其是控制权与安全边界问题。让 AI Agent 操作真实浏览器会话,必须建立清晰的权限管控和操作审计机制,以防范潜在风险。

目前,官方的 Chrome MCP 客户端在处理数百个标签页时可能不够稳定。为此,Petr Baudis 开发了一个优化技能 chrome-cdp-skill。安装方式如下:
bash
npx skills add https://github.com/pasky/chrome-cdp-skill

此外,用户也可直接在 chrome://inspect 中开启调试开关来使用基础功能。据悉,OpenClaw 等平台也将在新版本中集成此支持,未来执行浏览器操作任务的 Token 消耗有望进一步降低。

浏览器操作是 LLM 最重要的能力扩展之一,Chrome 原生集成 MCP 将为众多现有的自动化工作流带来便利。


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/archives/25632

(0)
上一篇 2026年3月14日 上午11:14
下一篇 2026年3月14日 下午7:53

相关推荐

  • 澳洲放羊大叔的AI编程革命:5行Bash脚本引爆硅谷,睡觉时AI自动完成5万美元项目

    最近,一个名为“Ralph”的AI编程技巧在全球技术社区迅速走红。其核心魔力在于:用户无需手动编写代码,只需设定目标,AI便能在后台自动完成整个开发流程,甚至在你睡觉时完成工作。令人惊讶的是,如此强大的工具,其核心代码仅由5行Bash脚本构成。 在Ralph迅速走红之后,Claude Code官方也推出了一套Ralph Wiggum插件。该插件通过“停止钩子…

    2026年1月23日
    50500
  • Hulu-Med:开源统一医学视觉语言大模型,破解医疗AI碎片化与透明度困局

    在医疗人工智能领域,长期以来存在着两大核心挑战:任务与模态的碎片化,以及技术实现的不透明性。传统医学AI模型通常针对特定任务(如影像诊断、病理分析或手术指导)和单一模态(如2D图像、3D体积或文本)进行优化,形成了众多性能卓越但彼此孤立的“专科助手”。这种碎片化架构不仅导致临床应用中需要拼凑复杂系统来处理多模态数据,增加了维护成本,更限制了AI从跨模态关联中…

    2025年11月13日
    40500
  • Jeff Dean预言AI时代工程师革命:管理50个智能体实习生,核心技能从写代码转向“定义问题”

    关键词: 智能体、Jeff Dean、全栈协同、多模态、定义问题 “未来每个工程师可能会各自管理 50 个智能体‘实习生’,完成大量并行任务,而且沟通效率会比人与人协作更高。未来最重要的技能将会是‘写清楚需求’,因为智能体的输出质量完全取决于你如何定义问题。” 2026年3月,谷歌首席AI科学家、传奇工程师杰夫·迪恩(Jeff Dean)在一次深度访谈中,提…

    2026年3月14日
    29800
  • Emu3.5:原生多模态世界模型的范式革命与第三种Scaling路径

    2025年,人工智能领域正经历一场从语言智能向物理世界智能的深刻范式转移。”世界模型”这一概念已从学术构想演变为科技巨头竞逐的核心战场,其目标在于构建能够理解、预测并生成动态物理环境的AI系统。谷歌的Genie 3凭借一句话生成720p实时模拟世界的能力,被业界喻为”游戏引擎2.0″;李飞飞团队推出的RTFM模…

    2025年11月3日
    33000
  • 阿里开源ROCK:构建智能体规模化训练的“实战演练场”,打通Agentic AI落地关键环节

    在人工智能技术快速演进的当下,大语言模型正经历从静态文本生成到动态环境交互的深刻范式转变。最前沿的模型已进化为能够与外部环境深度交互的Agentic模型,这不仅代表技术层面的进步,更标志着AI应用场景的根本性扩展。当前几乎所有SOTA级模型都具备了多轮交互能力,能够通过工具调用、代码执行、外部API调用等方式与环境进行实质性交互。简单来说,模型仅“能说”已无…

    2025年11月26日
    33800