AI大模型周报:阿里通义、阶跃星辰、智谱AI、Anthropic、OpenAI等巨头密集发布新模型,涵盖编程、视频生成、文档理解与智能体应用

AI大模型周报:阿里通义、阶跃星辰、智谱AI、Anthropic、OpenAI等巨头密集发布新模型,涵盖编程、视频生成、文档理解与智能体应用

2月1日

  • 【开源】阿里通义发布Qwen3-Coder-Next
    这是一个编程智能体模型,采用总参数80B的MoE架构,每次推理仅激活3B参数。在SWE-Bench Verified测试中,问题解决率超过70%,实现了高性能与低算力成本的平衡,适合对算力敏感的本地化开发场景。
    详情请参见:https://qwen.ai/blog?id=qwen3-coder-next

2月2日

  • 【闭源】阿里发布wan2.6-r2v-flash
    该模型能够基于参考视频和图像的角色形象,生成多镜头视频,并支持自动配音。
    详情请参见:https://help.aliyun.com/zh/model-studio/wan-video-to-video-api-reference

  • 【开源】阶跃星辰发布Step 3.5 Flash
    这是一个1960亿参数的Agent专用高速基座模型。它采用稀疏MoE架构,总参数1960亿但仅激活110亿,支持256K超长上下文。配合独创的MTP-3技术(单次预测3个token),推理速度最高可达350 TPS,在保证复杂数学推理能力的同时,显著降低了智能体应用的响应延迟。
    详情请参见:https://static.stepfun.com/blog/step-3.5-flash/

  • 【闭源】xAI发布Grok Imagine 1.0
    该模型正式进军视频生成领域,可生成长度最长10秒、分辨率达720p的高质量视频。其核心亮点在于采用先进的音视频联合建模技术,实现了精准的声画对齐与富有情感表现力的音频合成。
    详情请参见:https://x.ai/news/grok-imagine-api

2月3日

  • 【开源】智谱AI发布GLM-OCR
    这是一个用于复杂文档理解的多模态OCR模型,基于GLM-V编码器-解码器架构。通过引入多token预测(MTP)损失和稳定全任务强化学习,提升了训练效率、识别精度和泛化能力。该模型仅0.9B参数,在OmniDocBench V1.5上以94.62分排名第一,支持vLLM、SGLang和Ollama部署,适合高并发服务和边缘部署场景。
    详情请参见:https://huggingface.co/zai-org/GLM-OCR

2月5日

  • 【闭源】Anthropic发布Claude Opus 4.6
    这是目前最智能的模型,专为复杂智能体任务和长时程工作设计。Opus 4.6推荐使用自适应思考模式,手动思考模式已被弃用,且不支持预填充助手消息。
    详情请参见:https://www.anthropic.com/news/claude-opus-4-6

  • 【闭源】OpenAI发布GPT-5.3-Codex
    这是目前最强大的智能体编码模型。该模型首次结合了Codex与GPT-5的训练栈,将一流的代码生成、推理和通用智能融合于一体。其速度提升约25%,在关键基准测试中创下新高,实现了从代码生成到可主动引导的通用编程智能体的飞跃。
    详情请参见:https://openai.com/zh-Hans-CN/index/introducing-gpt-5-3-codex/

2月7日

  • 【闭源】Anthropic推出fast mode研究预览版
    该模式用于Opus 4.6模型,通过speed参数实现显著更快的输出token生成速度。在高级定价下,快速模式的速度提升高达2.5倍。
    详情请参见:https://platform.claude.com/docs/en/build-with-claude/fast-mode

关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/archives/20861

(0)
上一篇 2026年2月9日 上午9:12
下一篇 2026年2月9日 下午1:29

相关推荐

  • 从规则到认知:TwinMarket如何用大语言模型重塑金融市场仿真

    三十年前,圣塔菲研究所的“人工股票市场”实验揭示了传统Agent-Based Models(ABM)的根本困境:它们难以捕捉人类投资者复杂的认知偏差、情绪波动和社交影响。如今,大语言模型(LLM)的出现为这一领域带来了范式转变的可能。香港中文大学(深圳)与南京大学的研究团队推出的TwinMarket平台,正是这一转变的里程碑式实践。该平台通过构建千人规模的L…

    2025年11月15日
    22700
  • OpenClaw全球爆火:龙虾教徒日烧10亿token,AI Agent成新宠

    全球掀起OpenClaw热潮 近日,黄仁勋公开表示,OpenClaw可能是历史上最重要的软件发布。 这股风潮迅速席卷全球。在国内,某云服务商宣布提供线下免费安装服务,吸引了从2岁孩童到60岁长者的广泛人群,现场排起长队。 当前全网热议的“养龙虾”,主角并非水产养殖户,而是指代训练和配置OpenClaw AI Agent的开发者与爱好者。 这股狂热并不局限于国…

    2026年3月7日
    42900
  • 奥特曼自曝:不想当上市公司CEO,豪赌1.4万亿算力押注AGI未来

    近日,OpenAI CEO山姆·奥特曼做客《Big Technology Podcast》节目,分享了诸多犀利观点。 访谈中,奥特曼曝出不少引人注目的言论。例如,他明确表示:“对于担任一家上市公司的CEO,我一点都不感到兴奋。”此言一出,迅速被外媒捕捉并广泛报道。 本次访谈直面了许多尖锐问题:OpenAI的收入将如何匹配其1.4万亿美元的算力投入承诺?公司的…

    2025年12月20日
    40500
  • 文心一言5.0正式版深度评测:国产大模型如何突破算力桎梏,在多模态赛道站稳脚跟?

    核心结论: 文心一言5.0正式版在预览版基础上进行了针对性打磨,整体可用性有所提升,在国产大模型中站稳了第二梯队的位置。其核心优势在于长链推理、多轮对话的稳定性,但算力消耗与上下文幻觉问题仍是主要挑战。 逻辑能力表现:注1:表格为突出对比关系,仅展示部分可对照模型,非完整排序。注2:题目及测试方式,参见《大语言模型逻辑能力横评(25年12月榜)》,新增#55…

    2026年1月23日
    39400
  • OpenAI人才地震再升级!核心VP主动降级跳槽Anthropic,只为回归一线RL研究

    OpenAI人才地震再升级!核心VP主动降级跳槽Anthropic,只为回归一线RL研究 前OpenAI研究副总裁马克斯·施瓦泽(Max Schwarzer)近日宣布离职,并已加入竞争对手Anthropic。这位主导了o1、o3及GPT-5系列模型后期训练的核心人物,其离职理由并非被高薪挖角,而是“渴望回归一线独立贡献者(IC)的研究工作”。 施瓦泽在Ope…

    2026年3月5日
    22400