开源模型 - 鲸林向海

阿里Qwen3.5-122B-A10B实测：1220亿参数开源模型性能超Qwen3-Max，成本更低

Qwen3.5-122B-A10B是阿里Qwen3.5 Medium系列的开源模型，总参数量为1220亿，采用256个专家的稀疏混合专家（MoE）架构，每次前向传播仅激活约100亿参数。该模型基于Gated Delta Networks与稀疏MoE的混合架构，支持文本、图像和视频输入。官方宣称其在纯文本任务上的性能可媲美前代旗舰模型Qwen3-Max，同时成…

2026年2月26日

2.8K000

大模型评测

通义 Qwen3.5-Flash 测评：开源新锐的剑之所及

核心结论：开源新锐的剑之所及基本情况：通义千问近期发布了Qwen3.5-Flash模型。该模型是开源Qwen3.5-35B-A3B的增强版本。官方宣称此代Flash模型的能力可媲美前代Qwen3-235B。在推理模式下，其表现确实大幅领先于235B；但在新模式下的稳定性仍需打磨，综合中位表现与235B基本持平。考虑到235B的参数量级更大，这一结果仍显…

2026年2月26日

559000

AI产业动态

AI大模型周报：阿里Qwen3.5 Plus多模态突破、谷歌Gemini 3.1 Pro推理升级、蚂蚁Ling-2.5即时模型开源

2月16日【开源】阿里推出最新模型 Qwen3.5 Plus，支持文本、图像和视频多模态输入。该模型在语言理解、逻辑推理、代码生成、智能体任务、图像理解、视频理解、图形用户界面（GUI）等多种任务中表现卓越，并支持内置工具调用。详情请参见：https://help.aliyun.com/zh/model-studio/text-generation 【开…

2026年2月23日

296000

AI产业动态

通义Qwen3.5-Plus深度测评：开源战神部队的排头兵，推理效率与性价比双突破

短的结论：开源战神部队的排头兵基本情况： Qwen3.5-Plus 的到来比预期更快。通义实验室延续了其“新一代模型跨级挑战上一代”的进化方法论，此前Qwen2.5-80B 曾战平旧款235B模型，如今这一策略再次上演：不到400B参数的Plus模型，在能力上已能追赶上一代万亿参数规模的Max模型。其单位Token的推理性能也达到了前所未有的优秀水平。要…

2026年2月18日

1.0K000

AI产业动态

AI大模型周报：蚂蚁Ring-2.5-1T开源、OpenAI发布GPT-5.3-Codex-Spark、字节跳动多模态模型全面升级

2月11日【开源】蚂蚁集团旗下团队 inclusionAI 发布 Ring-2.5-1T，这是 Ring-1T 的升级版本，核心特性可概括为“快、深、长”。其生成效率提升超过 3 倍，访存开销降低 10 倍；具备国际数学奥林匹克竞赛金牌级别的深度思考能力，并能连续工作 2 小时编写出迷你操作系统。该模型采用 MIT 协议完全开源。模型详情：https:…

2026年2月16日

260000

AI产业动态

GLM-5引爆AI编程革命：中国大模型从“炫技”迈向“系统工程”时代

我们每天都在见证「全球大模型第一股」智谱的历史新高。 2026 年的春节档，注定将被写入中国 AI 的发展史。过去半个月，AI 社区被两颗「超新星」彻底点燃：一颗是字节跳动发布的 Seedance 2.0，它用震撼的视频生成能力横扫了全球社交网络，代表了 AI 在感性与创意维度的大爆发；而另一颗，则是这几天让开发者们彻夜未眠的智谱 GLM-5。可以说，S…

2026年2月13日

316000

AI产业动态

GLM-5引领中国AI成熟期：从炫技到系统工程的跨越

我们每天都在见证「全球大模型第一股」智谱的历史新高。 2026 年的春节档，注定将被写入中国 AI 的发展史。过去半个月，AI 社区被两颗「超新星」彻底点燃：一颗是字节跳动发布的 Seedance 2.0，它用震撼的视频生成能力横扫了全球社交网络，代表了 AI 在感性与创意维度的大爆发；而另一颗，则是这几天让开发者们彻夜未眠的智谱 GLM-5。可以说，S…

2026年2月13日

542000

AI产业动态

GLM-5震撼发布：744B参数开源巨兽，长程智能体与复杂系统工程新标杆

GLM-5正式发布，其定位直指Claude，专注于解决复杂的系统工程与长程智能体任务。模型参数规模从GLM-4.5的355B（32B活跃）大幅跃升至744B（40B活跃），预训练数据量也从23T token扩充至28.5T token。在技术层面，GLM-5采用了GlmMoeDsa架构，直接集成了来自DeepSeek的DSA稀疏注意力与MTP多标记预测技术…

2026年2月12日

381000

AI产业动态

智谱开源GLM-OCR模型评测：0.9B参数如何拳打GPT5.2，脚踢Gemini-3-Pro？

GLM-OCR 模型评测：0.9B 参数下的文本识别与表格解析实战 OCR（光学字符识别）技术正持续演进。近期，智谱 AI 开源了其轻量级模型「GLM-OCR」，尽管参数量仅为 0.9B，但据称在 OmniDocBench V1.5 等基准测试中表现不俗，尤其在处理手写体、代码文档、印章及复杂表格等场景时展现出竞争力。官方数据显示，该模型在多类文档的识别任…

2026年2月11日

920000

AI产业动态

MOSS-TTS Family：模思智能发布全场景语音生成模型家族，实现高保真音色克隆与实时交互

当一段语音不仅需要“像某个人”、“准确地读出每个字”，还需要在不同内容中自然切换说话方式，在几十分钟的叙述中持续稳定，在对话、角色、实时交互等不同形态下都能直接使用——单一的TTS模型，往往已经不够用了。模思智能及OpenMOSS团队发布了MOSS-TTS Family，一套面向高保真、高表现力与复杂场景生成的开源语音生成模型家族。 MOSS-TTS Fa…

2026年2月11日

584000