开源模型 - 鲸林向海

阿里Qwen3.5-27B实测：270亿参数密集模型杀入前十，成本骤降59%！

阿里在推出Qwen3.5系列的首款模型Qwen3.5-Plus后，于春节后发布了中型模型系列。Qwen3.5-27B是该系列中的密集模型，其全部270亿参数在每次推理时均被激活，未采用MoE机制。该模型延续了Qwen3.5的混合注意力架构，以3:1的比例交替使用Gated DeltaNet线性注意力层和标准全局注意力层，支持最高262K至1M的上下文窗口，并…

2026年2月27日

744000

AI产业动态

阶跃星辰杀入AI季后赛，Step 3.5 Flash凭速度与智商跻身“新六小虎”第一梯队

国产大模型“季后赛”激战正酣春节刚过，国产大模型领域的竞争已进入白热化阶段。一方面，行业巨头投入巨大资源争夺市场：字节豆包、阿里千问、腾讯元宝等通过总计超40亿元的红包活动，吸引了海量用户参与。其成效显著：除夕当晚，豆包的AI互动量达19亿次，千问用户通过“一句话下单”功能完成了近2亿次操作。据报道，相关团队的员工在春节期间也持续工作，密切关注着竞争…

2026年2月26日

261000

大模型评测

阿里Qwen3.5-122B-A10B实测：1220亿参数开源模型性能超Qwen3-Max，成本更低

Qwen3.5-122B-A10B是阿里Qwen3.5 Medium系列的开源模型，总参数量为1220亿，采用256个专家的稀疏混合专家（MoE）架构，每次前向传播仅激活约100亿参数。该模型基于Gated Delta Networks与稀疏MoE的混合架构，支持文本、图像和视频输入。官方宣称其在纯文本任务上的性能可媲美前代旗舰模型Qwen3-Max，同时成…

2026年2月26日

910000

大模型评测

通义 Qwen3.5-Flash 测评：开源新锐的剑之所及

核心结论：开源新锐的剑之所及基本情况：通义千问近期发布了Qwen3.5-Flash模型。该模型是开源Qwen3.5-35B-A3B的增强版本。官方宣称此代Flash模型的能力可媲美前代Qwen3-235B。在推理模式下，其表现确实大幅领先于235B；但在新模式下的稳定性仍需打磨，综合中位表现与235B基本持平。考虑到235B的参数量级更大，这一结果仍显…

2026年2月26日

187000

AI产业动态

AI大模型周报：阿里Qwen3.5 Plus多模态突破、谷歌Gemini 3.1 Pro推理升级、蚂蚁Ling-2.5即时模型开源

2月16日【开源】阿里推出最新模型 Qwen3.5 Plus，支持文本、图像和视频多模态输入。该模型在语言理解、逻辑推理、代码生成、智能体任务、图像理解、视频理解、图形用户界面（GUI）等多种任务中表现卓越，并支持内置工具调用。详情请参见：https://help.aliyun.com/zh/model-studio/text-generation 【开…

2026年2月23日

120000

AI产业动态

通义Qwen3.5-Plus深度测评：开源战神部队的排头兵，推理效率与性价比双突破

短的结论：开源战神部队的排头兵基本情况： Qwen3.5-Plus 的到来比预期更快。通义实验室延续了其“新一代模型跨级挑战上一代”的进化方法论，此前Qwen2.5-80B 曾战平旧款235B模型，如今这一策略再次上演：不到400B参数的Plus模型，在能力上已能追赶上一代万亿参数规模的Max模型。其单位Token的推理性能也达到了前所未有的优秀水平。要…

2026年2月18日

369000

AI产业动态

AI大模型周报：蚂蚁Ring-2.5-1T开源、OpenAI发布GPT-5.3-Codex-Spark、字节跳动多模态模型全面升级

2月11日【开源】蚂蚁集团旗下团队 inclusionAI 发布 Ring-2.5-1T，这是 Ring-1T 的升级版本，核心特性可概括为“快、深、长”。其生成效率提升超过 3 倍，访存开销降低 10 倍；具备国际数学奥林匹克竞赛金牌级别的深度思考能力，并能连续工作 2 小时编写出迷你操作系统。该模型采用 MIT 协议完全开源。模型详情：https:…

2026年2月16日

85000

AI产业动态

GLM-5引爆AI编程革命：中国大模型从“炫技”迈向“系统工程”时代

我们每天都在见证「全球大模型第一股」智谱的历史新高。 2026 年的春节档，注定将被写入中国 AI 的发展史。过去半个月，AI 社区被两颗「超新星」彻底点燃：一颗是字节跳动发布的 Seedance 2.0，它用震撼的视频生成能力横扫了全球社交网络，代表了 AI 在感性与创意维度的大爆发；而另一颗，则是这几天让开发者们彻夜未眠的智谱 GLM-5。可以说，S…

2026年2月13日

127000

AI产业动态

GLM-5引领中国AI成熟期：从炫技到系统工程的跨越

我们每天都在见证「全球大模型第一股」智谱的历史新高。 2026 年的春节档，注定将被写入中国 AI 的发展史。过去半个月，AI 社区被两颗「超新星」彻底点燃：一颗是字节跳动发布的 Seedance 2.0，它用震撼的视频生成能力横扫了全球社交网络，代表了 AI 在感性与创意维度的大爆发；而另一颗，则是这几天让开发者们彻夜未眠的智谱 GLM-5。可以说，S…

2026年2月13日

188000

AI产业动态

GLM-5震撼发布：744B参数开源巨兽，长程智能体与复杂系统工程新标杆

GLM-5正式发布，其定位直指Claude，专注于解决复杂的系统工程与长程智能体任务。模型参数规模从GLM-4.5的355B（32B活跃）大幅跃升至744B（40B活跃），预训练数据量也从23T token扩充至28.5T token。在技术层面，GLM-5采用了GlmMoeDsa架构，直接集成了来自DeepSeek的DSA稀疏注意力与MTP多标记预测技术…

2026年2月12日

144000