AI大模型周报:阿里通义、阶跃星辰、智谱AI、Anthropic、OpenAI等巨头密集发布新模型,涵盖编程、视频生成、文档理解与智能体应用

AI大模型周报:阿里通义、阶跃星辰、智谱AI、Anthropic、OpenAI等巨头密集发布新模型,涵盖编程、视频生成、文档理解与智能体应用

2月1日

  • 【开源】阿里通义发布Qwen3-Coder-Next
    这是一个编程智能体模型,采用总参数80B的MoE架构,每次推理仅激活3B参数。在SWE-Bench Verified测试中,问题解决率超过70%,实现了高性能与低算力成本的平衡,适合对算力敏感的本地化开发场景。
    详情请参见:https://qwen.ai/blog?id=qwen3-coder-next

2月2日

  • 【闭源】阿里发布wan2.6-r2v-flash
    该模型能够基于参考视频和图像的角色形象,生成多镜头视频,并支持自动配音。
    详情请参见:https://help.aliyun.com/zh/model-studio/wan-video-to-video-api-reference

  • 【开源】阶跃星辰发布Step 3.5 Flash
    这是一个1960亿参数的Agent专用高速基座模型。它采用稀疏MoE架构,总参数1960亿但仅激活110亿,支持256K超长上下文。配合独创的MTP-3技术(单次预测3个token),推理速度最高可达350 TPS,在保证复杂数学推理能力的同时,显著降低了智能体应用的响应延迟。
    详情请参见:https://static.stepfun.com/blog/step-3.5-flash/

  • 【闭源】xAI发布Grok Imagine 1.0
    该模型正式进军视频生成领域,可生成长度最长10秒、分辨率达720p的高质量视频。其核心亮点在于采用先进的音视频联合建模技术,实现了精准的声画对齐与富有情感表现力的音频合成。
    详情请参见:https://x.ai/news/grok-imagine-api

2月3日

  • 【开源】智谱AI发布GLM-OCR
    这是一个用于复杂文档理解的多模态OCR模型,基于GLM-V编码器-解码器架构。通过引入多token预测(MTP)损失和稳定全任务强化学习,提升了训练效率、识别精度和泛化能力。该模型仅0.9B参数,在OmniDocBench V1.5上以94.62分排名第一,支持vLLM、SGLang和Ollama部署,适合高并发服务和边缘部署场景。
    详情请参见:https://huggingface.co/zai-org/GLM-OCR

2月5日

  • 【闭源】Anthropic发布Claude Opus 4.6
    这是目前最智能的模型,专为复杂智能体任务和长时程工作设计。Opus 4.6推荐使用自适应思考模式,手动思考模式已被弃用,且不支持预填充助手消息。
    详情请参见:https://www.anthropic.com/news/claude-opus-4-6

  • 【闭源】OpenAI发布GPT-5.3-Codex
    这是目前最强大的智能体编码模型。该模型首次结合了Codex与GPT-5的训练栈,将一流的代码生成、推理和通用智能融合于一体。其速度提升约25%,在关键基准测试中创下新高,实现了从代码生成到可主动引导的通用编程智能体的飞跃。
    详情请参见:https://openai.com/zh-Hans-CN/index/introducing-gpt-5-3-codex/

2月7日

  • 【闭源】Anthropic推出fast mode研究预览版
    该模式用于Opus 4.6模型,通过speed参数实现显著更快的输出token生成速度。在高级定价下,快速模式的速度提升高达2.5倍。
    详情请参见:https://platform.claude.com/docs/en/build-with-claude/fast-mode

关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/archives/20861

(0)
上一篇 2026年2月9日 上午9:12
下一篇 2026年2月9日 下午1:29

相关推荐

  • 信仰与算法的终极博弈:前谷歌研究员如何向梵蒂冈预警AGI末日危机

    在人工智能技术飞速发展的今天,关于通用人工智能(AGI)可能带来的生存风险讨论已从硅谷实验室延伸至全球最古老的权力中心——梵蒂冈。前谷歌研究员约翰-克拉克·莱文(John-Clark Levin)正领导一场独特的游说行动,试图让天主教廷正视AGI可能引发的“代码末日”,这场信仰与算法之间的博弈,或将重塑人类在智能时代的命运轨迹。 莱文并非普通的科技从业者。作…

    2025年12月2日
    31100
  • 奥赛奖牌得主去向大揭秘:成为亿万富翁的概率是普通人1500倍

    奥赛奖牌得主去向大揭秘:成为亿万富翁的概率是普通人1500倍 全!部!暴!露! 知名X平台博主Deedy,通过自研爬虫,利用Exa数据抓取工具,成功挖掘了过去25年间18000名IMO、IOI、IPhO奖牌得主的职业去向,并追溯到了其中约50% 的人。 结论只有两行字,但每个数字都狠狠戳在了我的心巴上!!! 这群人成为亿万富翁的概率,是普通人的1500倍。 …

    2026年4月30日
    15200
  • AI成本坍塌与人力价值重构:技术通缩时代的经济学悖论

    过去一年,人工智能领域正在经历一场前所未有的价格革命。从GPT-3.5等级模型每百万token费用从20美元暴跌至0.07美元,到高端模型以每年900倍的速度降价,AI服务的成本曲线呈现出近乎垂直的下坠态势。这种价格坍塌不仅重塑了技术应用的经济逻辑,更引发了对劳动力市场价值体系的深度重构。当算法成本趋近于零时,那些无法被自动化替代的人类劳动反而成为稀缺资源,…

    2025年11月5日
    51100
  • 突破GPU瓶颈:d-PLENA NPU架构实现扩散大模型采样2.53倍加速

    关键词:dLLMs、NPU、采样优化、d-PLENA、GEMM 扩散型大语言模型(dLLM)是一种融合了扩散模型迭代去噪特性的大语言模型,可实现并行 Token 生成。但其采样阶段展现出与以通用矩阵乘法(GEMM)为核心的 Transformer 层截然不同的计算特征。 Beyond GEMM-Centric NPUs: Enabling Efficient…

    2026年2月10日
    37800
  • AI革命下的程序员生存指南:当代码稀疏化遇上技能焦虑,如何驾驭这场“9级大地震”?

    年末假期是总结与思考的时刻,但对于程序员而言,深入思考后可能会感到一丝不安。 近期,Andrej Karpathy 在 X 平台发布的一条推文,引发了数万程序员和从业者的强烈共鸣与热议。 Karpathy 坦言:“我从未像现在这样,感觉自己作为一名程序员如此落后。” 他指出,编程这一职业正在被彻底重构。程序员直接编写的代码越来越少,更多的工作转变为在各种工具…

    2025年12月27日
    36100