深夜重磅!Claude Mythos预览版官宣不开放,DeepSeek网页端静默上线专家模式,实测能力差异显著

北京时间深夜,AI领域接连发生两起重要事件:

  1. Anthropic正式发布Claude Mythos预览版,但因其能力过强,该模型将不会向公众开放
  2. DeepSeek网页端迎来重大更新,静默上线“专家模式。此次更新没有发布会,没有官方博客,甚至没有推文公告。

深夜重磅!Claude Mythos预览版官宣不开放,DeepSeek网页端静默上线专家模式,实测能力差异显著

在DeepSeek网页端的输入框上方,悄然出现了两个新图标:一个闪电和一个钻石,分别对应 “快速模式”“专家模式”

深夜重磅!Claude Mythos预览版官宣不开放,DeepSeek网页端静默上线专家模式,实测能力差异显著
深夜重磅!Claude Mythos预览版官宣不开放,DeepSeek网页端静默上线专家模式,实测能力差异显著

悬停图标可见提示:快速模式“适合日常对话,即时响应”;专家模式“擅长复杂问题,高峰需等待”。实测表明,这两种模式的区别,远不止于其他AI产品中“快速”与“思考”的简单差异——毕竟DeepSeek对话框中本就已有开启深度思考的选项。

根据目前实测及网友分析,两种模式的差异大致如下:

  • 快速模式:可识别图片与文件中的文字,响应速度快且即时。其背后运行的很可能是一个经过速度优化的、更轻量的V4 Lite模型。
    深夜重磅!Claude Mythos预览版官宣不开放,DeepSeek网页端静默上线专家模式,实测能力差异显著
  • 专家模式:疑似路由至更大、更强的模型——有猜测认为,这很可能就是DeepSeek V4正式版的某种形态。但目前它不支持文件上传,也缺乏多模态能力。更强的模型反而功能更少,这合理吗?
    深夜重磅!Claude Mythos预览版官宣不开放,DeepSeek网页端静默上线专家模式,实测能力差异显著
    深夜重磅!Claude Mythos预览版官宣不开放,DeepSeek网页端静默上线专家模式,实测能力差异显著

实测能力差异

我们进行了一轮简单测试。例如,要求两种模式分别编写一个p5.js程序,模拟球体在旋转六边形内受重力与摩擦力影响的弹跳。结果显示,专家模式给出的结果更符合物理直觉,落点更准,弹跳轨迹更真实。
深夜重磅!Claude Mythos预览版官宣不开放,DeepSeek网页端静默上线专家模式,实测能力差异显著

相比之下,快速模式的结果肉眼可见地差了一个档次。
深夜重磅!Claude Mythos预览版官宣不开放,DeepSeek网页端静默上线专家模式,实测能力差异显著

这种差距颇具说服力。物理仿真对数学推理能力要求高,较弱的模型容易产生“形似而神非”的结果。专家模式在此处的表现,体现了实打实的能力差异。

但网友 @AiBattle_ 让其制作“太空侵略者”游戏的测试结果却有些意外:专家模式与快速模式的输出差距并不明显。该测试者判断:“我估计专家模式现在路由的仍然是某个版本的V4 Lite。要看到完整版V4在网页端上线,可能还得再等一阵。” 此判断与外部报道的时间线基本吻合。此前据晚点LatePost报道,V4正式版预计今年4月亮相,届时大概率仍是“开源最强”,但报道也指出“很难是碾压级的强”。换言之,此次灰度上线的“专家模式”,未必是最终形态。

在创意写作方面,我们为两种模式出了一道辩论写作题:“替无聊辩护,论证无聊是现代人的奢侈品”。专家模式的输出更长,逻辑链更完整;快速模式的文风则相对自然朴实。
深夜重磅!Claude Mythos预览版官宣不开放,DeepSeek网页端静默上线专家模式,实测能力差异显著
深夜重磅!Claude Mythos预览版官宣不开放,DeepSeek网页端静默上线专家模式,实测能力差异显著

有趣的是,在此任务上,两者速度差距不大,甚至专家模式的思考时间更短(快速5秒,专家3秒)。这有些反直觉,但可能与任务性质有关——创意写作对模型规模的敏感度,远低于数学推理类任务。

对于简单任务,两个模式差异有限;越是需要深度推理的场景,专家模式的优势越明显。

在数学逻辑题“绳子绕地球一圈,加长1米并均匀撑开,缝隙多高?”中,尽管两者答案相同,但过程迥异。快速模式的回答简略;专家模式则逐步拆解,清晰交代每个推导环节,更贴近“展示思考过程”的指令要求。
深夜重磅!Claude Mythos预览版官宣不开放,DeepSeek网页端静默上线专家模式,实测能力差异显著
深夜重磅!Claude Mythos预览版官宣不开放,DeepSeek网页端静默上线专家模式,实测能力差异显著

未来展望:Vision模式与产品分层

值得一提的是,目前网页端实际上线仅快速与专家两种模式,但此前爆料显示,第三个选项“Vision模式”正在路上
深夜重磅!Claude Mythos预览版官宣不开放,DeepSeek网页端静默上线专家模式,实测能力差异显著

关注DeepSeek技术路线的博主Teortaxes指出,将Vision单独列为一类,是不同寻常的设计。他提到,DeepSeek此前拒绝在网页端部署DS-VL系列,原因是“尚未成熟”。若Vision模式真的上线,其背后支撑的可能已是一个“完全功能化”的视觉语言模型。Teortaxes甚至给出了更大胆的猜测:该视觉模型可能并非常规VLM,而是某种“深度统一世界模型”,是Janus系列的下一步演化,或其他非传统架构。

当然,这仅是猜测。也有网友 @xhyctf 表示,对DeepSeek前端代码的逆向工程显示,Vision模式并无独立模型,所谓的“视觉理解”很可能只是在快速模式下悄然增加了一个参数:filefeature.vision = true

无论如何,有一点是确定的:DeepSeek在多模态方向一直有所布局,或许只差一个合适的发布时机。而将快速、专家等入口呈现在用户面前,背后指向一个更值得关注的方向:
深夜重磅!Claude Mythos预览版官宣不开放,DeepSeek网页端静默上线专家模式,实测能力差异显著

DeepSeek开始实施产品分层了。

自去年初爆火以来,DeepSeek的产品逻辑一直是高度“反商业”的——API定价较低,网页端完全免费,功能也无门槛区分。但问题随之而来:长期维持“全免费、无分层”的运营模式,商业上不可持续。

如今,DeepSeek开始将“更强的模型”与“更基础的模型”设为两个入口。专家模式目前虽仍免费,但此架构一旦搭成,后续在此基础上构建付费体系,技术上已无障碍。

当然,分层的目的未必仅为收费。

将用户自然分流至两个入口,让需要深度推理的请求走专家模式,日常对话走快速模式——这本身即是一种算力调度策略,有助于限额限流,缓解峰值压力。
深夜重磅!Claude Mythos预览版官宣不开放,DeepSeek网页端静默上线专家模式,实测能力差异显著

收费是一条路,限额是另一条路,两者可择一而行,亦可并行。纵观全局,这也构成了一条完整的铺垫路径:

先灰度上线分层入口 → 让用户感知差异 → 打通多模态和文件能力 → 视觉模式开闸 → 对更强大的模式实施限额或定价。

当然,这仅是个人推测,毕竟DeepSeek向来不按常理出牌。

诚然,人们为DeepSeek贴上了太多标签:技术理想主义、反商业、普惠AI。然而,GPU的推理成本每月都是实打实的支出。幻方的量化收益再丰厚,也很难仅靠API收入填补一个全球级AI服务无限期免费运营的窟窿。DeepSeek搅动了整个AI圈,但现实也终将搅动DeepSeek。


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/archives/29098

(0)
上一篇 13小时前
下一篇 11小时前

相关推荐

  • DeepSeek研究员陈德里乌镇首秀:从AI乐观到社会隐忧的深度思辨

    在浙江乌镇举行的世界互联网大会上,备受瞩目的「杭州六小龙」首次同台亮相。阿里云创始人王坚院士亲自主持,宇树创始人及CEO王兴兴、强脑科技创始人及CEO韩璧丞、群核科技创始人及董事长黄晓煌、游戏科学创始人及CEO、《黑神话:悟空》制作人冯骥、云深处科技创始人及CEO朱秋国等悉数落座。 然而,在「杭州六小龙」中最为引人注目的DeepSeek,其创始人及CEO梁文…

    2025年11月15日
    28700
  • Dual-Flow:颠覆传统对抗攻击范式,实现多目标多模型黑盒攻击新突破

    在人工智能安全领域,对抗攻击一直是研究的热点与难点。近日,清华大学与蚂蚁数科联合在NeurIPS 2024会议上提出的Dual-Flow框架,为这一领域带来了革命性的突破。该框架通过创新的双流结构和训练机制,实现了对多种模型、多种类别的黑盒攻击,且无需依赖目标模型结构或梯度信息,为AI模型的安全性评估与防御体系构建提供了全新的视角与工具。 Dual-Flow…

    2025年12月15日
    24900
  • AI教育主权争夺战:算法如何重构大学课堂的权力格局与认知边界?

    AI教育主权争夺战:算法如何重构大学课堂的权力格局与认知边界? 全球高等教育机构正以前所未有的速度拥抱人工智能。《自然》杂志近期一篇题为《大学正在拥抱AI:学生会变得更聪明还是停止思考?》的报道,揭示了这一浪潮下的深层变革。 从清华大学为新生配备AI助理,到加州州立大学系统将52万师生接入ChatGPT Edu,再到谷歌向全球学生免费开放Gemini,AI正…

    2025年11月11日
    23900
  • 超越结果正确:Coding Agent过程合规评测新范式揭秘

    在 AI 辅助编程工具的实际应用中,一个值得深思的现象正在浮现:用户对 Agent 的不满,往往不是因为它“做不到”,而是因为它“做得不对”。通过观察用户反馈,最高频的抱怨指向同一个问题:Agent 不遵循明确给出的指令。这些场景或许并不陌生——用户在系统提示中明确要求“不要使用 emoji”,Agent 却在代码注释里加上表情符号;用户要求“先备份再修改”…

    2026年1月15日
    31500
  • 黄仁勋揭秘AI基建狂潮:6600亿美元投入背后,算力翻倍收入或翻四倍的商业逻辑

    上周,英伟达股价创下近一年来的单日最大涨幅,达到7.9%,公司总市值回升至4.5万亿美元。这一强劲表现,与核心客户近期在财报会议上释放的积极信号密切相关。 Meta、亚马逊、谷歌和微软等科技巨头均向投资者表示,计划在2026年大幅增加数据中心和专用芯片的资本支出,合计金额预计高达6600亿美元。这一数字较2025年的4100亿美元和2024年的2450亿美元…

    2026年2月9日
    46300