阿里千问3.5-Plus重磅开源:原生多模态、性能倒挂、价格屠夫,开源大模型迎来王炸级突破

前阵子,各大模型厂商纷纷迭代产品,功能之多令人眼花缭乱。

就在大家以为临近春节,AI圈已无新牌可打时,阿里通义千问却毫无预兆地甩出了一对“王炸”——全新一代大模型 Qwen 3.5-Plus 正式重磅开源

该模型在多模态理解、复杂推理、编程及Agent等核心维度上,不仅全面领先于同级开源模型,更在多项基准测试中足以媲美顶级闭源模型。

阿里千问3.5-Plus重磅开源:原生多模态、性能倒挂、价格屠夫,开源大模型迎来王炸级突破

此次发布的核心亮点如下:

  1. 原生多模态:告别“拼装”式挂件,实现对物理世界的无损直觉感知。
  2. 性能倒挂:多项基准媲美甚至超越GPT-5.2和Gemini-3-Pro等顶级闭源模型。
  3. 架构突变:采用极致稀疏MoE架构,总参数量达397B,但推理时仅需激活17B参数。
  4. 价格屠夫:其API定价仅为Gemini-3-Pro的1/18,同时部署显存占用降低60%,推理效率大幅提升,最大吞吐量可提升至19倍。

这意味着,仅需运行20B级别模型的算力成本,即可获得接近400B模型的智力水平,加之极低的API定价,真正实现了“物美价廉”。

阿里千问3.5-Plus重磅开源:原生多模态、性能倒挂、价格屠夫,开源大模型迎来王炸级突破

此外,模型还将其支持的语言扩展至201种,一跃成为具备全球通用潜力的“世界模型”。更强的多语言与小语种兼容性,意味着模型能学习到更密集的世界知识与推理逻辑,预计其能力进化速度也将随之加快,这对从事出海业务的开发者尤为利好。

那么,这样一款开源大模型的实际效果究竟如何?在模型发布前,我们获得了Qwen 3.5-Plus的API内测权限。下面将围绕“视觉+推理”方向,从生活场景到代码生产力,对其进行实测。

一、年夜饭食材识别与成本核算

多数多模态模型需额外借助视觉编码器,常出现“看图说话”不准确的问题。Qwen 3.5-Plus带来的最大变化之一是“原生多模态”,首先测试此项能力。

测评时恰逢筹备年夜饭,于是从网络找了一张丰盛的年夜饭图片,要求AI列出食材、计算成本并估算耗时。提示词如下:

  • 请以表格形式,列出图片中菜品所需的食材,估算其市场价格,最后汇总制作这顿饭大致需要的时间和总花费。

阿里千问3.5-Plus重磅开源:原生多模态、性能倒挂、价格屠夫,开源大模型迎来王炸级突破

这考验模型的菜品识别、食材分解及市场行情了解能力。出乎意料的是,模型不仅能准确识别菜品,还能在价格方面提供灵活的参考区间。

阿里千问3.5-Plus重磅开源:原生多模态、性能倒挂、价格屠夫,开源大模型迎来王炸级突破

此外,它还能将年夜饭的准备流程分解为不同阶段,并精准估算每一步所需时间。

阿里千问3.5-Plus重磅开源:原生多模态、性能倒挂、价格屠夫,开源大模型迎来王炸级突破

二、手写数学题推理验证

接着提升难度,测试逻辑推理能力。我们使用了一张字迹潦草且仅截取一半解题过程的手写数学题图片,直接要求模型:“识别图中数学题的解题过程,并分析其是否正确?”

阿里千问3.5-Plus重磅开源:原生多模态、性能倒挂、价格屠夫,开源大模型迎来王炸级突破

题目字迹难以辨认,但Qwen 3.5-Plus依然精准识别了所有公式。它不仅推理出这只是解题的前半部分,还敏锐地指出了其中遗漏的一个关键符号。

阿里千问3.5-Plus重磅开源:原生多模态、性能倒挂、价格屠夫,开源大模型迎来王炸级突破

通过以上两轮测试可见,Qwen 3.5-Plus的视觉与推理能力得到了显著增强。无论是复杂的年夜饭场景,还是信息残缺的潦草数学题,它都展现出高超的识别与判断力,印证了原生多模态“透过模糊表象补全逻辑断层”的核心优势。

当然,仅能“看图做题”还不够。对于开发者而言,更关心它能否通过视觉理解来提升生产力。接下来,尝试让它根据手绘草图直接生成可用代码。

三、手绘草图生成前端代码

为测试模型对抽象信息的理解能力,我们使用了一张随手绘制的服务器监控后台草图。草图线条潦草,大致布局为:左侧菜单栏,右上方饼图,下方为表格。

将图片提交给模型,并提出要求:“仅用一个HTML文件实现此布局,让我可以直接预览效果。”

阿里千问3.5-Plus重磅开源:原生多模态、性能倒挂、价格屠夫,开源大模型迎来王炸级突破

Qwen 3.5-Plus的反馈速度与理解深度令人意外。仅经过6.3秒的“思考”,它便完成对草图的解构,识别出“左侧列表+右上饼图+右下表格”的结构。

阿里千问3.5-Plus重磅开源:原生多模态、性能倒挂、价格屠夫,开源大模型迎来王炸级突破

运行其生成的HTML代码,预览效果良好。

阿里千问3.5-Plus重磅开源:原生多模态、性能倒挂、价格屠夫,开源大模型迎来王炸级突破

值得注意的是,虽然草图中饼图在上、表格在下,但模型在生成时自动将其优化为更适合宽屏显示的“左右布局”(图表居中,表格在右)。这表明它并非机械地识别像素,而是基于对页面设计的理解进行优化,提升了用户体验。

四、基于截图对比自动修复Bug

尽管优化后的布局视觉效果更佳,但我们仍希望它严格遵循草图原布局。于是,我们将「手绘草图」与「生成的网页截图」一并提交,并给出模糊指令:“找出两者不同之处并进行修正。”

阿里千问3.5-Plus重磅开源:原生多模态、性能倒挂、价格屠夫,开源大模型迎来王炸级突破 阿里千问3.5-Plus重磅开源:原生多模态、性能倒挂、价格屠夫,开源大模型迎来王炸级突破

模型随即给出了具体的修正方案与代码。再次预览,页面布局已完全回归草图原貌。

阿里千问3.5-Plus重磅开源:原生多模态、性能倒挂、价格屠夫,开源大模型迎来王炸级突破

这意味着,开发者无需详细描述界面问题或Bug细节。只需像日常验收一样,将参考图与结果图交给AI并指出“这不对,按原图改”,AI便能基于视觉理解自动完成代码样式的批量修正。“让视觉编程成为真正的生产力工具”,在此得以体现。

目前看来,Qwen 3.5-Plus堪称一款能真正融入生产流程的Visual Coding开源大模型。

结语

经过上述实测,最大的感受是:Qwen 3.5-Plus正在模糊开源与闭源模型的界限。

过去,获得顶级的推理与多模态能力往往依赖昂贵的闭源API。Qwen 3.5-Plus通过“原生多模态”与“极致MoE架构”打破了这一局面。它向业界证明,顶尖的视觉直觉与逻辑推理并非必须依赖万亿参数的堆砌,也不再是少数巨头的技术护城河。

对于开发者而言,此后仅需极低的成本,便能构建一个“能看懂草图、能自动修Bug”的智能开发助手。

在除夕这个特殊时间点,Qwen 3.5-Plus的发布无疑带来了巨大惊喜。

Qwen 3.5-Plus模型已在ModelScope与HuggingFace平台开源,可供下载与本地部署,也可通过千问App直接体验。


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:http://www.itsolotime.com/archives/21679

(0)
上一篇 2026年2月16日 下午5:48
下一篇 2026年2月17日 上午5:47

相关推荐

  • Meta闪电收购AI社交平台Moltbook,40天创业神话背后的安全与连接博弈

    Meta闪电收购AI社交平台Moltbook,40天创业神话背后的安全与连接博弈 上线仅40天的AI智能体社交平台Moltbook已被收购,收购方为Facebook的母公司Meta。 此前在收购OpenClaw上未能如愿的扎克伯格,此次迅速出手,将Moltbook及其两位创始人Matt Schlicht和Ben Parr一并收入麾下。具体收购金额未披露,两位…

    4天前
    19000
  • InfinityStar:时空金字塔架构革新视频生成,自回归模型挑战DiT主导地位

    在人工智能生成内容领域,视频生成技术正经历从扩散模型向自回归架构的范式转移。字节跳动商业化技术团队最新提出的InfinityStar方法,凭借其创新的时空金字塔建模框架,在NeurIPS’25 Oral论文中展示了挑战当前主流Diffusion Transformer(DiT)视频生成方案的潜力。这一突破不仅体现在生成质量上,更关键的是在计算效率方面实现了数…

    2025年11月14日
    16200
  • 多模态深度研究评测新标准:MMDR-Bench实现过程可核验、证据可追溯

    Deep Research Agent 已变得流行,但其评估标准仍停留在“看起来很强”的层面。 生成内容像论文,并不等同于真正进行了研究。尤其当证据来自图表、截图、论文插图或示意图时,一个关键问题浮现:模型究竟是“看懂了”,还是仅仅“编造得像懂了一样”? 为了将多模态深度研究的评估从“读起来不错”拉回到更严格的标准,俄亥俄州立大学与 Amazon Scien…

    2026年2月14日
    10500
  • 突破扩散大语言模型解码瓶颈:复旦大学团队提出一致性轨迹强化学习新范式

    扩散大语言模型(Diffusion Large Language Models)作为生成式人工智能领域的新兴范式,在2025年迎来了关键性突破。2月,Inception Labs推出首个商业级扩散大语言模型Mercury;同期,中国人民大学开源了8B参数的LLaDA模型;5月,Gemini Diffusion的发布进一步印证了这一技术路线的潜力。这些进展表明…

    2025年11月5日
    19300
  • GDPS 2025:上海张江的具身智能“协同大考”,如何定义机器人产业未来?

    一场具身智能的“终极大考”正在上海张江科学会堂上演。全球具身智能顶级赛事——GDPS 2025拉开帷幕,这场赛事不仅汇聚了智元、宇树等国内头部机器人企业,更吸引了国际参赛队伍,将百大真实场景浓缩为一道道协同考题,从工业搬运、花艺创作到康养护理、灾害救援,全面检验机器人从“赛博推理”走向“物理执行”的能力。 舞台两侧,智元远征A2与灵犀X2机器人联袂亮相,穿着…

    2025年12月13日
    16600