AI大模型周报:阿里、腾讯、Anthropic等巨头密集发布,多模态与推理能力成焦点

AI大模型周报:阿里、腾讯、Anthropic等巨头密集发布,多模态与推理能力成焦点

10月13日

【开源】 阿里开源 Qwen3-VL-8B-Thinking 与 Qwen3-VL-8B-Instruct 模型。作为 Qwen3-VL 系列的 8B Dense 模型,它们显存占用更低,具备多模态理解与推理能力,支持长视频、长文档等超长上下文输入,并集成了视觉 2D/3D 定位、全面空间感知与万物识别功能。

10月14日

【闭源】 腾讯混元发布 Hunyuan-Translation 翻译模型。该模型支持 33 种语言互译及 5 种民族语言互译,在同尺寸模型中效果领先,在 WMT25 比赛的 30 种语言评测中获得第一,并在开源测试集 Flores200 上表现优异。

10月15日

【闭源】 Anthropic 发布 Claude Haiku 4.5。这是目前最快且最智能的 Haiku 模型,具备接近前沿模型的性能,适用于实时应用、高容量处理和成本敏感型部署。

【闭源】 谷歌发布 Veo 3.1 及 3.1 Fast 公开预览版。新版本支持延长视频生成,可参考最多三张图片,并提供首尾帧控制功能,新增了 4 秒、6 秒、8 秒的时长选项。

【闭源】 字节豆包发布 Doubao-Seed-1-6-Lite-251015 模型。该模型支持可手动关闭及调节长度的深度思考功能,具备文本生成、图片理解、视频理解及工具调用能力。

【闭源】 阿里发布 Qwen3-VL-Flash-2025-10-15 模型。作为 Qwen3 系列的小尺寸视觉理解模型,它有效融合了思考与非思考模式,在效果和响应速度上均有提升。

10月16日

【开源】 百度发布 PaddleOCR-VL-0.9B 多模态文档解析模型。该模型仅 0.9B 参数,在多个权威评测中刷新记录,支持 109 种语言,能够精准识别图片中的文本、手写汉字、表格、公式和图表等复杂元素,推理速度达每秒 1881 个 Token,较 MinerU 提升 14.2%。


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/archives/14702

(0)
上一篇 2025年10月20日 下午12:38
下一篇 2025年10月20日 下午12:58

相关推荐

  • SGLang Model Gateway 0.2:一体化AI原生编排解决方案的突破性实践

    在AI模型部署与推理的复杂生态中,尽管市场上涌现了众多GPU内核优化、推理引擎加速项目以及从传统云原生演进而来的AI网关工具,但真正实现一体化、原生AI编排的解决方案却长期处于空白状态。实际生产环境中,开发者往往需要自行整合多个组件,形成效率低下、维护困难的“缝合怪”系统。Oracle与SGLang团队敏锐地捕捉到这一痛点,近期推出了生产就绪的SGLang …

    2025年10月25日
    43300
  • 快排算法之父托尼·霍尔逝世,他创造的“十亿美元错误”如何影响编程世界?

    快排算法之父、图灵奖得主托尼·霍尔逝世,享年92岁 在计算机科学领域,几乎无人能绕开快速排序算法。作为全球使用最广泛的排序算法之一,它已被集成进从C、Java到Python等几乎所有主流编程语言的标准库中。 然而,快速排序仅仅是托尼·霍尔漫长而卓越学术生涯的起点。作为1980年图灵奖得主,他提出了用于形式化验证程序正确性的霍尔逻辑,创造了深刻影响Go语言设计…

    2026年3月11日
    44300
  • Meta闪电收购AI社交平台Moltbook,40天创业神话背后的安全与连接博弈

    Meta闪电收购AI社交平台Moltbook,40天创业神话背后的安全与连接博弈 上线仅40天的AI智能体社交平台Moltbook已被收购,收购方为Facebook的母公司Meta。 此前在收购OpenClaw上未能如愿的扎克伯格,此次迅速出手,将Moltbook及其两位创始人Matt Schlicht和Ben Parr一并收入麾下。具体收购金额未披露,两位…

    2026年3月11日
    50200
  • 京东AI解法:开源JoyAI-LLM Flash降本增效,数字人性能超SOTA,具身智能覆盖百品牌

    京东AI解法:开源JoyAI-LLM Flash降本增效,数字人性能超SOTA,具身智能覆盖百品牌 AI技术加速迭代,但成本效率与性能的平衡、产业落地“最后一公里”的打通,仍是行业面临的共性挑战。3月24日,京东公布了其AI研发应用的部分阶段性进展,提出了针对上述难题的解决方案。 01 开源大模型JoyAI-LLM Flash,大幅降低AI使用门槛 在模型能…

    2026年3月25日
    38200
  • 效率革命:微博VibeThinker以15亿参数重塑大模型竞争格局

    在AI行业普遍陷入“参数崇拜”的背景下,微博AI近期发布的VibeThinker开源大模型,以仅15亿参数的轻量级架构,在国际顶级数学竞赛基准测试中击败了参数量高达6710亿的DeepSeek R1模型,这一突破性成果不仅挑战了传统技术评价标准,更可能引发AI产业从“规模竞赛”向“效率革命”的深刻转型。 ### 技术范式突破:小模型如何实现复杂推理能力 长期…

    2025年11月18日
    39200