今天,OpenClaw 正式宣布接入 DeepSeek V4!在最新发布的 OpenClaw 2026.4.24 版本中,DeepSeek V4 的双版本模型已全面集成——V4 Flash 被设定为默认大模型,而 V4 Pro 也已上线模型库。这意味着,从此刻起,全球每一位更新 OpenClaw 的用户,打开应用的第一秒,与自己对话的“大脑”就是 DeepSeek V4 Flash。
可以说,DeepSeek V4 的接入,成为此次 OpenClaw 更新中最引人瞩目的亮点。消息一出,全网用户都跃跃欲试,激动不已。
此外,OpenClaw 还打通了 Google Meet,其实时语音通话功能让整个行业为之震撼。
DeepSeek V4 成为 OpenClaw 默认模型
两天前,DeepSeek V4 如惊雷般炸响,全球 AI 圈期待已久的开源新王者终于尘埃落定。OpenClaw 第一时间接入了 DeepSeek V4 的“双版本”,并将 V4 Flash 设为默认模型。这个被昵称为“龙虾”的框架,亲手将中国 AI 推向了舞台中央。
对于普通用户而言,最直观的变化是:上手 OpenClaw 时,默认进入的便是 DeepSeek V4 Flash 路线。让我们感受一下 V4 的含金量:
- DeepSeek V4 Pro:总参数高达 1.6 万亿,激活参数为 49B,采用 MoE 架构,是全球最大的开源模型。
- DeepSeek V4 Flash:总参数为 284B,激活参数仅 13B,同样基于 MoE 架构。它更小、更快、更便宜,但在 Max 模式下,其推理能力几乎能追平 Pro 版本。
两个模型均支持 100 万 token 的上下文长度,并采用 MIT 协议完全开源。
这次更新还修复了 DeepSeek 在多轮工具调用中的 thinking 和 replay 行为。此前,Agent 在连续调用工具或切换会话模型时,容易因 reasoning_content 缺失而触发 provider replay 检查错误。新版本补齐了相关占位逻辑,使 DeepSeek V4 Flash 和 DeepSeek V4 Pro 在长链路任务中运行得更加稳定。
这类修复看似偏向工程细节,但对 Agent 产品而言至关重要。OpenClaw 的核心场景早已不局限于聊天,更多时候是让模型连续调用浏览器、会议、语音、文件和插件。如果模型接入仅停留在文本回复层,其价值十分有限;真正影响用户体验的,是它能否支撑起复杂的任务链路。
“龙虾”打电话:Google Meet 成为内置插件
在此次更新中,Google Meet 被正式加入 OpenClaw,成为 bundled participant plugin。新版本支持个人谷歌账号授权、显式会议 URL 加入、Chrome 和 Twilio 实时传输,同时也支持 paired-node Chrome,用于 Parallels、BlackHole、SoX 等本地音频与浏览器的组合环境。
更重要的变化发生在会议结束后。OpenClaw 可以处理会议记录、录音、转写、智能笔记以及参会人会话,并能将结果导出为 Markdown 或其他类型文件。系统还支持查找最新会议记录,以及扫描历史 conference records。
这让 OpenClaw 在会议场景中的角色更加靠前。它承担的不仅仅是转写任务,而是会议的进入、实时参与、内容沉淀和结果回查。传统的 AI 会议助手大多围绕“记录”展开,而 OpenClaw 这次将会议变成了一个可被 Agent 调用和管理的工作节点。
实时语音接入完整 Agent
Talk、Voice Call 和 Google Meet 现在均可使用实时语音循环。这部分更新的重点在于,实时语音可以调用完整的 OpenClaw Agent。通过 openclaw_agent_consult,电话或会议中的问题可以交给后台 Agent 处理,Agent 再调用工具、查询上下文、组织答案,并用语音返回。
Voice Call 插件新增了 setup 和默认 dry-run 的 smoke command,用于在真实拨号前检查 Twilio 或其他 provider 是否就绪。Google provider 侧则新增了 Gemini Live 实时语音能力,支持双向音频和函数调用。Gateway/VoiceClaw 也加入了基于 Gemini Live 的 realtime brain WebSocket endpoint,并通过 owner-auth 进行权限限制。
这表明 OpenClaw 正在将语音打造成一级入口。文本框之外,电话和会议正在成为 Agent 的运行环境。
浏览器自动化:继续补齐工程短板
浏览器自动化是此次更新的另一个重点。新版本加入了 viewport coordinate clicks,支持 managed automation 和 existing-session automation,CLI 侧也新增了 openclaw browser click-coords 命令。当网页控件无法稳定识别时,坐标点击提供了兜底方案。
默认 action budget 被延长至 60 秒,以减少长等待被误判为失败的情况。浏览器 profile 也支持单独设置 headless 模式,一个 profile 可以无头运行,其他 profile 则不受影响。
Google Meet 相关的修复也集中在浏览器稳定性上。新版本可以复用已经打开的 Meet 标签页,浏览器超时后尝试恢复,还能识别登录、权限、麦克风选择等人工阻塞点。这些改动虽然不容易成为传播热点,但却直接影响 Agent 能否持续工作。浏览器 Agent 的问题常常出在标签页、权限、等待时间和恢复机制上。
插件和模型架构变得更轻
OpenClaw 同时也在降低启动负担。模型列表改用静态目录,减少了默认 models list 时的 registry 枚举。模型目录加入了 manifest-sourced model rows,使得 provider index、cache、onboarding 和 listing 可以在不加载 provider runtime 的情况下工作。
插件侧也在进行类似调整:modelCatalog、channelConfigs、setup.providers 等信息更多地从 manifest 暴露,descriptor-only setup contract 也变得更加明确。随着 Google Meet、Voice Call、PDF、Anthropic Vertex、Bonjour 等能力逐步插件化,启动时加载全部 runtime 会拖慢系统。新版本将描述信息前置,把运行时依赖后置。
这是一种典型的工程取舍:牺牲一点早期的兼容便利,换取更轻的启动路径和更清晰的插件边界。
SDK 发生破坏性变化
此次更新还包含一项破坏性变动:OpenClaw 移除了 Pi-only 的 api.registerEmbeddedExtensionFactory(...) 兼容路径。此后,bundled tool-result rewrites 需要使用 api.registerAgentToolResultMiddleware(...),并在 contracts.agentToolResultMiddleware 中声明目标 harness。
这会影响插件开发者。官方希望工具结果转换在 Pi 和 Codex app-server dynamic tools 中保持一致,旧接口需要迁移。相应地,OpenClaw 增加了插件兼容性 registry 和迁移记录,用于管理 SDK、配置、setup 和 runtime 的弃用路径。这背后是 OpenClaw 在整理早期快速扩张留下的接口债务。
OpenClaw 的方向更清晰了
此次更新覆盖了模型、会议、语音、浏览器、插件、诊断、TTS、Slack、Telegram 和 MCP 等多个模块。
DeepSeek V4被纳入默认模型路径,核心目标在于提升模型的底层能力;
Google Meet与语音通话功能的增强,则聚焦于优化协作入口的交互体验;
浏览器自动化、插件懒加载机制以及SDK迁移工作,共同为复杂任务的运行时环境夯实了工程基础。
OpenClaw正从一款单纯的聊天产品,逐步演进为完整的工作流系统。
参考资料:
https://github.com/openclaw/openclaw/releases/tag/v2026.4.24
关注“鲸栖”小程序,掌握最新AI资讯
本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/archives/32153

