Qwen3.5

阿里Qwen3.5小模型震撼发布：0.8B参数即可处理视频，边缘AI时代正式开启！

阿里通义千问发布了Qwen3.5系列的四款小参数规模模型，分别为0.8B、2B、4B和9B。该系列的核心创新在于引入了Gated DeltaNet混合注意力机制，此项技术借鉴自其397B参数的大模型。该架构采用三层线性注意力层对应一层全注意力层的设计。线性层负责常规计算，内存占用保持恒定；全注意力层仅在需要精确计算时激活。这种3:1的配比使得模型在维持高质…

2026年3月3日

709000

大模型评测

阿里Qwen3.5-27B深度评测：理科思维突出，文档处理与逻辑推理是亮点，艺术创作待提升

阿里近期推出了Qwen3.5-27B模型，作为Qwen3.5系列中的中型主力版本，它定位为一款兼顾高性价比与密集推理需求的开源模型。其实际性能表现如何？以下是本次评测的核心结论。核心结论：三大亮点： OCR与文档理解能力出色：在纯文本提取、复杂表格结构还原及合并单元格识别等任务中表现精准，效果优于部分更大参数的模型。空间逻辑与数学推理能力强：在立体…

2026年3月1日

1.4K000

大模型评测

阿里Qwen3.5-27B实测：270亿参数密集模型杀入前十，成本骤降59%！

阿里在推出Qwen3.5系列的首款模型Qwen3.5-Plus后，于春节后发布了中型模型系列。Qwen3.5-27B是该系列中的密集模型，其全部270亿参数在每次推理时均被激活，未采用MoE机制。该模型延续了Qwen3.5的混合注意力架构，以3:1的比例交替使用Gated DeltaNet线性注意力层和标准全局注意力层，支持最高262K至1M的上下文窗口，并…

2026年2月27日

2.3K000

大模型评测

阿里Qwen3.5-122B-A10B实测：1220亿参数开源模型性能超Qwen3-Max，成本更低

Qwen3.5-122B-A10B是阿里Qwen3.5 Medium系列的开源模型，总参数量为1220亿，采用256个专家的稀疏混合专家（MoE）架构，每次前向传播仅激活约100亿参数。该模型基于Gated Delta Networks与稀疏MoE的混合架构，支持文本、图像和视频输入。官方宣称其在纯文本任务上的性能可媲美前代旗舰模型Qwen3-Max，同时成…

2026年2月26日

3.4K000

大模型工程

阿里Qwen3.5-Plus实测：3970亿参数模型性能飙升，成本骤降47%

阿里正式发布Qwen3.5系列，并推出了该系列的首个模型——Qwen3.5-397B-A17B的开放权重版本。作为原生视觉-语言模型，Qwen3.5-397B-A17B在推理、编程、智能体能力与多模态理解等全方位基准评测中表现优异。该模型采用创新的混合架构，将线性注意力（Gated Delta Networks）与稀疏混合专家（MoE）相结合，总参数量达39…

2026年2月21日

2.3K000

AI产业动态

Qwen3.5震撼发布：3970亿参数性能超万亿模型，推理吞吐量提升19倍，开源AI新标杆诞生

智东西2月16日报道，刚刚，Qwen3.5正式发布并开源，在多模态理解、复杂推理、编程、Agent智能体等几大能力上领先同级开源模型，多项基准测试成绩媲美甚至超越GPT-5.2、Gemini 3 Pro等闭源第一梯队模型。 Qwen3.5-Plus总参数为3970亿，激活参数仅170亿，其性能超越了万亿参数的Qwen3-Max模型。在部署上，其显存占用降低了…

2026年2月16日

628000