闭源模型
-
AI大模型2月重磅更新盘点:阿里、阶跃星辰、智谱AI等巨头竞相发布,编程、视频、文档处理全面突破
2月1日 【开源】阿里通义千问发布 Qwen3-Coder-Next 阿里发布了编程智能体模型 Qwen3-Coder-Next。该模型采用总参数为 800 亿的混合专家架构,每次推理仅激活 30 亿参数。在 SWE-Bench Verified 测试中,其问题解决率超过 70%,在保证高性能的同时有效控制了算力成本,适合对算力敏感的本地化开发场景。 技术博…
-
AI大模型周报:阿里通义、阶跃星辰、智谱AI、Anthropic、OpenAI等巨头密集发布新模型,涵盖编程、视频生成、文档理解与智能体应用
2月1日 【开源】阿里通义发布Qwen3-Coder-Next 这是一个编程智能体模型,采用总参数80B的MoE架构,每次推理仅激活3B参数。在SWE-Bench Verified测试中,问题解决率超过70%,实现了高性能与低算力成本的平衡,适合对算力敏感的本地化开发场景。 详情请参见:https://qwen.ai/blog?id=qwen3-coder-…
-
AI周报:智谱GLM-4.6V革新视觉Agent,谷歌Gemini 2.5与OpenAI GPT-5.2齐发,多模态与智能体技术迎来爆发期
12月8日 【开源】 智谱AI发布GLM-4.6V系列多模态大模型,包含GLM-4.6V(106B)云端版和GLM-4.6V-Flash(9B)轻量版。该系列模型支持128k超长上下文,在同参数规模下实现了视觉理解SOTA性能。其最大亮点在于首次将Function Call能力原生融入视觉模型架构,打通了从“视觉感知”到“可执行行动”的完整链路,为多模态Ag…
-
AI大模型周报:字节跳动、百度、OpenAI密集更新,闭源与开源模型齐头并进
11月11日 【闭源】 字节跳动发布 doubao-seed-code,这是一款专为实际开发场景打造的AI编程模型。该模型强化了Bug修复能力和前端开发能力,并支持输入透明Cache能力,以有效降低使用成本。 【开源】 百度发布 ERNIE-4.5-VL-28B-A3B-Thinking。该模型在ERNIE-4.5-VL-28B-A3B基础上训练而成,是一个…
