大模型更新
-
AI大模型周报:阿里通义、阶跃星辰、智谱AI、Anthropic、OpenAI等巨头密集发布新模型,涵盖编程、视频生成、文档理解与智能体应用
2月1日 【开源】阿里通义发布Qwen3-Coder-Next 这是一个编程智能体模型,采用总参数80B的MoE架构,每次推理仅激活3B参数。在SWE-Bench Verified测试中,问题解决率超过70%,实现了高性能与低算力成本的平衡,适合对算力敏感的本地化开发场景。 详情请参见:https://qwen.ai/blog?id=qwen3-coder-…
-
AI周报:字节豆包Agent突破、通义语音全家桶、谷歌Gemini 3 Flash亮相
12月15日 【闭源】 字节跳动发布豆包 doubao-seed-1-8-251215,在Agent能力、多模态理解和上下文管理三大方面实现突破。其工具调用、复杂指令遵循和操作系统代理能力大幅增强;视觉理解基础能力显著提升,支持低帧率理解超长视频,在视频运动理解、复杂空间理解和文档结构化解析能力上全面升级;原生支持智能上下文管理,可配置上下文压缩策略,在任务…
-
AI大模型周报:阿里、腾讯、Anthropic等巨头密集发布,多模态与推理能力成焦点
10月13日 【开源】 阿里开源 Qwen3-VL-8B-Thinking 与 Qwen3-VL-8B-Instruct 模型。作为 Qwen3-VL 系列的 8B Dense 模型,它们显存占用更低,具备多模态理解与推理能力,支持长视频、长文档等超长上下文输入,并集成了视觉 2D/3D 定位、全面空间感知与万物识别功能。 10月14日 【闭源】 腾讯混元发…
