AI大模型周报:阿里、腾讯、Anthropic等巨头密集发布,多模态与推理能力成焦点

AI大模型周报:阿里、腾讯、Anthropic等巨头密集发布,多模态与推理能力成焦点

10月13日

【开源】 阿里开源 Qwen3-VL-8B-Thinking 与 Qwen3-VL-8B-Instruct 模型。作为 Qwen3-VL 系列的 8B Dense 模型,它们显存占用更低,具备多模态理解与推理能力,支持长视频、长文档等超长上下文输入,并集成了视觉 2D/3D 定位、全面空间感知与万物识别功能。

10月14日

【闭源】 腾讯混元发布 Hunyuan-Translation 翻译模型。该模型支持 33 种语言互译及 5 种民族语言互译,在同尺寸模型中效果领先,在 WMT25 比赛的 30 种语言评测中获得第一,并在开源测试集 Flores200 上表现优异。

10月15日

【闭源】 Anthropic 发布 Claude Haiku 4.5。这是目前最快且最智能的 Haiku 模型,具备接近前沿模型的性能,适用于实时应用、高容量处理和成本敏感型部署。

【闭源】 谷歌发布 Veo 3.1 及 3.1 Fast 公开预览版。新版本支持延长视频生成,可参考最多三张图片,并提供首尾帧控制功能,新增了 4 秒、6 秒、8 秒的时长选项。

【闭源】 字节豆包发布 Doubao-Seed-1-6-Lite-251015 模型。该模型支持可手动关闭及调节长度的深度思考功能,具备文本生成、图片理解、视频理解及工具调用能力。

【闭源】 阿里发布 Qwen3-VL-Flash-2025-10-15 模型。作为 Qwen3 系列的小尺寸视觉理解模型,它有效融合了思考与非思考模式,在效果和响应速度上均有提升。

10月16日

【开源】 百度发布 PaddleOCR-VL-0.9B 多模态文档解析模型。该模型仅 0.9B 参数,在多个权威评测中刷新记录,支持 109 种语言,能够精准识别图片中的文本、手写汉字、表格、公式和图表等复杂元素,推理速度达每秒 1881 个 Token,较 MinerU 提升 14.2%。


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:http://www.itsolotime.com/archives/14702

(0)
上一篇 2025年10月20日 下午12:38
下一篇 2025年10月20日 下午12:58

相关推荐

  • 文心5.0正式版发布:2.4万亿参数全模态大模型登顶全球第一梯队

    文心大模型5.0正式版发布:2.4万亿参数全模态大模型登顶全球第一梯队 文心大模型5.0正式版,现已正式发布。 这意味着,自2025年11月Preview版初露锋芒后,这个参数量高达2.4万亿、主打原生全模态的“巨无霸”模型的“完全体”已经到来。 先来看一组“入场成绩单”: 近三个月,在全球大模型竞技场LMArena上,文心5.0 Preview版多次在文本…

    2026年1月23日
    4000
  • 破折号成瘾:AI写作风格如何暴露大模型训练数据的历史断层

    在人工智能写作领域,一个看似微不足道的标点符号——破折号——正成为揭示大模型训练数据来源与时代局限性的关键线索。用户普遍观察到,以ChatGPT为代表的AI产品在生成文本时频繁使用破折号,这种现象已从偶然特征演变为AI写作的标志性风格。OpenAI甚至将“减少破折号使用”作为产品改进功能单独发布,反映出用户对此现象的普遍关注。这一现象背后,隐藏着大模型训练数…

    2025年11月29日
    7700
  • 从“我不是机器人”到隐私监控:reCAPTCHA的演化与AI训练数据伦理困境

    近日,一段关于“猫屎团”验证码的调侃视频在社交媒体上引发热议。视频中,用户需要将灰色的“猫屎团”拖入垃圾桶,并勾选“我不是猫”才能通过验证。这一看似荒诞的场景,实际上折射出图形验证码(CAPTCHA)技术演化的深层逻辑——从单纯的人机识别工具,演变为大规模数据收集机制,最终引发隐私监控的伦理争议。 验证码技术的起源可追溯至2000年代初,其全称“全自动区分计…

    2025年11月12日
    9000
  • 谷歌Nano Banana 2预览版深度解析:AI图像生成的新纪元与多模态能力突破

    近日,谷歌下一代AI图像生成模型Nano Banana 2(简称NB2)的预览版在第三方平台Media IO意外亮相,引发了科技界的广泛关注。尽管尚未正式发布,但基于泄露的测试结果,NB2展现出的性能飞跃已足以重新定义当前AI图像生成的边界。本文将从技术能力、应用场景及行业影响三个维度,对NB2进行全面剖析。 在技术层面,NB2的核心提升体现在生成速度、分辨…

    2025年11月9日
    8400
  • AI生成低质量视频泛滥YouTube:算法推荐超20%为AI内容,产业化趋势引关注

    你的视频推荐流,正在被AI“吞噬” 一项最新调查发现,YouTube算法向新用户展示的视频中,有超过20%的内容是AI制造的低质量视频。这意味着,我们平时刷到的每5条视频中,可能就有1条是AI快速生成的产物。 不仅如此,这类内容贫乏的AI视频正逐渐走向产业化,甚至演变成一门规模不断扩大的“生意”。 AI低质量视频开始“量产” 这一结论来自美国创意软件公司Ka…

    2026年1月2日
    12700