大模型更新

AI大模型周报：阿里通义、阶跃星辰、智谱AI、Anthropic、OpenAI等巨头密集发布新模型，涵盖编程、视频生成、文档理解与智能体应用

2月1日【开源】阿里通义发布Qwen3-Coder-Next 这是一个编程智能体模型，采用总参数80B的MoE架构，每次推理仅激活3B参数。在SWE-Bench Verified测试中，问题解决率超过70%，实现了高性能与低算力成本的平衡，适合对算力敏感的本地化开发场景。详情请参见：https://qwen.ai/blog?id=qwen3-coder-…

2026年2月9日

225000

AI产业动态

AI周报：字节豆包Agent突破、通义语音全家桶、谷歌Gemini 3 Flash亮相

12月15日【闭源】字节跳动发布豆包 doubao-seed-1-8-251215，在Agent能力、多模态理解和上下文管理三大方面实现突破。其工具调用、复杂指令遵循和操作系统代理能力大幅增强；视觉理解基础能力显著提升，支持低帧率理解超长视频，在视频运动理解、复杂空间理解和文档结构化解析能力上全面升级；原生支持智能上下文管理，可配置上下文压缩策略，在任务…

2025年12月22日

200000

AI产业动态

AI大模型周报：阿里、腾讯、Anthropic等巨头密集发布，多模态与推理能力成焦点

10月13日【开源】阿里开源 Qwen3-VL-8B-Thinking 与 Qwen3-VL-8B-Instruct 模型。作为 Qwen3-VL 系列的 8B Dense 模型，它们显存占用更低，具备多模态理解与推理能力，支持长视频、长文档等超长上下文输入，并集成了视觉 2D/3D 定位、全面空间感知与万物识别功能。 10月14日【闭源】腾讯混元发…

2025年10月20日

182000