阿里千问3.5-Plus重磅开源:原生多模态、性能倒挂、价格屠夫,开源大模型迎来王炸级突破

前阵子,各大模型厂商纷纷迭代产品,功能之多令人眼花缭乱。

就在大家以为临近春节,AI圈已无新牌可打时,阿里通义千问却毫无预兆地甩出了一对“王炸”——全新一代大模型 Qwen 3.5-Plus 正式重磅开源

该模型在多模态理解、复杂推理、编程及Agent等核心维度上,不仅全面领先于同级开源模型,更在多项基准测试中足以媲美顶级闭源模型。

阿里千问3.5-Plus重磅开源:原生多模态、性能倒挂、价格屠夫,开源大模型迎来王炸级突破

此次发布的核心亮点如下:

  1. 原生多模态:告别“拼装”式挂件,实现对物理世界的无损直觉感知。
  2. 性能倒挂:多项基准媲美甚至超越GPT-5.2和Gemini-3-Pro等顶级闭源模型。
  3. 架构突变:采用极致稀疏MoE架构,总参数量达397B,但推理时仅需激活17B参数。
  4. 价格屠夫:其API定价仅为Gemini-3-Pro的1/18,同时部署显存占用降低60%,推理效率大幅提升,最大吞吐量可提升至19倍。

这意味着,仅需运行20B级别模型的算力成本,即可获得接近400B模型的智力水平,加之极低的API定价,真正实现了“物美价廉”。

阿里千问3.5-Plus重磅开源:原生多模态、性能倒挂、价格屠夫,开源大模型迎来王炸级突破

此外,模型还将其支持的语言扩展至201种,一跃成为具备全球通用潜力的“世界模型”。更强的多语言与小语种兼容性,意味着模型能学习到更密集的世界知识与推理逻辑,预计其能力进化速度也将随之加快,这对从事出海业务的开发者尤为利好。

那么,这样一款开源大模型的实际效果究竟如何?在模型发布前,我们获得了Qwen 3.5-Plus的API内测权限。下面将围绕“视觉+推理”方向,从生活场景到代码生产力,对其进行实测。

一、年夜饭食材识别与成本核算

多数多模态模型需额外借助视觉编码器,常出现“看图说话”不准确的问题。Qwen 3.5-Plus带来的最大变化之一是“原生多模态”,首先测试此项能力。

测评时恰逢筹备年夜饭,于是从网络找了一张丰盛的年夜饭图片,要求AI列出食材、计算成本并估算耗时。提示词如下:

  • 请以表格形式,列出图片中菜品所需的食材,估算其市场价格,最后汇总制作这顿饭大致需要的时间和总花费。

阿里千问3.5-Plus重磅开源:原生多模态、性能倒挂、价格屠夫,开源大模型迎来王炸级突破

这考验模型的菜品识别、食材分解及市场行情了解能力。出乎意料的是,模型不仅能准确识别菜品,还能在价格方面提供灵活的参考区间。

阿里千问3.5-Plus重磅开源:原生多模态、性能倒挂、价格屠夫,开源大模型迎来王炸级突破

此外,它还能将年夜饭的准备流程分解为不同阶段,并精准估算每一步所需时间。

阿里千问3.5-Plus重磅开源:原生多模态、性能倒挂、价格屠夫,开源大模型迎来王炸级突破

二、手写数学题推理验证

接着提升难度,测试逻辑推理能力。我们使用了一张字迹潦草且仅截取一半解题过程的手写数学题图片,直接要求模型:“识别图中数学题的解题过程,并分析其是否正确?”

阿里千问3.5-Plus重磅开源:原生多模态、性能倒挂、价格屠夫,开源大模型迎来王炸级突破

题目字迹难以辨认,但Qwen 3.5-Plus依然精准识别了所有公式。它不仅推理出这只是解题的前半部分,还敏锐地指出了其中遗漏的一个关键符号。

阿里千问3.5-Plus重磅开源:原生多模态、性能倒挂、价格屠夫,开源大模型迎来王炸级突破

通过以上两轮测试可见,Qwen 3.5-Plus的视觉与推理能力得到了显著增强。无论是复杂的年夜饭场景,还是信息残缺的潦草数学题,它都展现出高超的识别与判断力,印证了原生多模态“透过模糊表象补全逻辑断层”的核心优势。

当然,仅能“看图做题”还不够。对于开发者而言,更关心它能否通过视觉理解来提升生产力。接下来,尝试让它根据手绘草图直接生成可用代码。

三、手绘草图生成前端代码

为测试模型对抽象信息的理解能力,我们使用了一张随手绘制的服务器监控后台草图。草图线条潦草,大致布局为:左侧菜单栏,右上方饼图,下方为表格。

将图片提交给模型,并提出要求:“仅用一个HTML文件实现此布局,让我可以直接预览效果。”

阿里千问3.5-Plus重磅开源:原生多模态、性能倒挂、价格屠夫,开源大模型迎来王炸级突破

Qwen 3.5-Plus的反馈速度与理解深度令人意外。仅经过6.3秒的“思考”,它便完成对草图的解构,识别出“左侧列表+右上饼图+右下表格”的结构。

阿里千问3.5-Plus重磅开源:原生多模态、性能倒挂、价格屠夫,开源大模型迎来王炸级突破

运行其生成的HTML代码,预览效果良好。

阿里千问3.5-Plus重磅开源:原生多模态、性能倒挂、价格屠夫,开源大模型迎来王炸级突破

值得注意的是,虽然草图中饼图在上、表格在下,但模型在生成时自动将其优化为更适合宽屏显示的“左右布局”(图表居中,表格在右)。这表明它并非机械地识别像素,而是基于对页面设计的理解进行优化,提升了用户体验。

四、基于截图对比自动修复Bug

尽管优化后的布局视觉效果更佳,但我们仍希望它严格遵循草图原布局。于是,我们将「手绘草图」与「生成的网页截图」一并提交,并给出模糊指令:“找出两者不同之处并进行修正。”

阿里千问3.5-Plus重磅开源:原生多模态、性能倒挂、价格屠夫,开源大模型迎来王炸级突破 阿里千问3.5-Plus重磅开源:原生多模态、性能倒挂、价格屠夫,开源大模型迎来王炸级突破

模型随即给出了具体的修正方案与代码。再次预览,页面布局已完全回归草图原貌。

阿里千问3.5-Plus重磅开源:原生多模态、性能倒挂、价格屠夫,开源大模型迎来王炸级突破

这意味着,开发者无需详细描述界面问题或Bug细节。只需像日常验收一样,将参考图与结果图交给AI并指出“这不对,按原图改”,AI便能基于视觉理解自动完成代码样式的批量修正。“让视觉编程成为真正的生产力工具”,在此得以体现。

目前看来,Qwen 3.5-Plus堪称一款能真正融入生产流程的Visual Coding开源大模型。

结语

经过上述实测,最大的感受是:Qwen 3.5-Plus正在模糊开源与闭源模型的界限。

过去,获得顶级的推理与多模态能力往往依赖昂贵的闭源API。Qwen 3.5-Plus通过“原生多模态”与“极致MoE架构”打破了这一局面。它向业界证明,顶尖的视觉直觉与逻辑推理并非必须依赖万亿参数的堆砌,也不再是少数巨头的技术护城河。

对于开发者而言,此后仅需极低的成本,便能构建一个“能看懂草图、能自动修Bug”的智能开发助手。

在除夕这个特殊时间点,Qwen 3.5-Plus的发布无疑带来了巨大惊喜。

Qwen 3.5-Plus模型已在ModelScope与HuggingFace平台开源,可供下载与本地部署,也可通过千问App直接体验。


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/archives/21679

(0)
上一篇 2天前
下一篇 2天前

相关推荐