阿里千问3.5-Plus重磅开源:原生多模态、性能倒挂、价格屠夫,开源大模型迎来王炸级突破

前阵子,各大模型厂商纷纷迭代产品,功能之多令人眼花缭乱。

就在大家以为临近春节,AI圈已无新牌可打时,阿里通义千问却毫无预兆地甩出了一对“王炸”——全新一代大模型 Qwen 3.5-Plus 正式重磅开源

该模型在多模态理解、复杂推理、编程及Agent等核心维度上,不仅全面领先于同级开源模型,更在多项基准测试中足以媲美顶级闭源模型。

阿里千问3.5-Plus重磅开源:原生多模态、性能倒挂、价格屠夫,开源大模型迎来王炸级突破

此次发布的核心亮点如下:

  1. 原生多模态:告别“拼装”式挂件,实现对物理世界的无损直觉感知。
  2. 性能倒挂:多项基准媲美甚至超越GPT-5.2和Gemini-3-Pro等顶级闭源模型。
  3. 架构突变:采用极致稀疏MoE架构,总参数量达397B,但推理时仅需激活17B参数。
  4. 价格屠夫:其API定价仅为Gemini-3-Pro的1/18,同时部署显存占用降低60%,推理效率大幅提升,最大吞吐量可提升至19倍。

这意味着,仅需运行20B级别模型的算力成本,即可获得接近400B模型的智力水平,加之极低的API定价,真正实现了“物美价廉”。

阿里千问3.5-Plus重磅开源:原生多模态、性能倒挂、价格屠夫,开源大模型迎来王炸级突破

此外,模型还将其支持的语言扩展至201种,一跃成为具备全球通用潜力的“世界模型”。更强的多语言与小语种兼容性,意味着模型能学习到更密集的世界知识与推理逻辑,预计其能力进化速度也将随之加快,这对从事出海业务的开发者尤为利好。

那么,这样一款开源大模型的实际效果究竟如何?在模型发布前,我们获得了Qwen 3.5-Plus的API内测权限。下面将围绕“视觉+推理”方向,从生活场景到代码生产力,对其进行实测。

一、年夜饭食材识别与成本核算

多数多模态模型需额外借助视觉编码器,常出现“看图说话”不准确的问题。Qwen 3.5-Plus带来的最大变化之一是“原生多模态”,首先测试此项能力。

测评时恰逢筹备年夜饭,于是从网络找了一张丰盛的年夜饭图片,要求AI列出食材、计算成本并估算耗时。提示词如下:

  • 请以表格形式,列出图片中菜品所需的食材,估算其市场价格,最后汇总制作这顿饭大致需要的时间和总花费。

阿里千问3.5-Plus重磅开源:原生多模态、性能倒挂、价格屠夫,开源大模型迎来王炸级突破

这考验模型的菜品识别、食材分解及市场行情了解能力。出乎意料的是,模型不仅能准确识别菜品,还能在价格方面提供灵活的参考区间。

阿里千问3.5-Plus重磅开源:原生多模态、性能倒挂、价格屠夫,开源大模型迎来王炸级突破

此外,它还能将年夜饭的准备流程分解为不同阶段,并精准估算每一步所需时间。

阿里千问3.5-Plus重磅开源:原生多模态、性能倒挂、价格屠夫,开源大模型迎来王炸级突破

二、手写数学题推理验证

接着提升难度,测试逻辑推理能力。我们使用了一张字迹潦草且仅截取一半解题过程的手写数学题图片,直接要求模型:“识别图中数学题的解题过程,并分析其是否正确?”

阿里千问3.5-Plus重磅开源:原生多模态、性能倒挂、价格屠夫,开源大模型迎来王炸级突破

题目字迹难以辨认,但Qwen 3.5-Plus依然精准识别了所有公式。它不仅推理出这只是解题的前半部分,还敏锐地指出了其中遗漏的一个关键符号。

阿里千问3.5-Plus重磅开源:原生多模态、性能倒挂、价格屠夫,开源大模型迎来王炸级突破

通过以上两轮测试可见,Qwen 3.5-Plus的视觉与推理能力得到了显著增强。无论是复杂的年夜饭场景,还是信息残缺的潦草数学题,它都展现出高超的识别与判断力,印证了原生多模态“透过模糊表象补全逻辑断层”的核心优势。

当然,仅能“看图做题”还不够。对于开发者而言,更关心它能否通过视觉理解来提升生产力。接下来,尝试让它根据手绘草图直接生成可用代码。

三、手绘草图生成前端代码

为测试模型对抽象信息的理解能力,我们使用了一张随手绘制的服务器监控后台草图。草图线条潦草,大致布局为:左侧菜单栏,右上方饼图,下方为表格。

将图片提交给模型,并提出要求:“仅用一个HTML文件实现此布局,让我可以直接预览效果。”

阿里千问3.5-Plus重磅开源:原生多模态、性能倒挂、价格屠夫,开源大模型迎来王炸级突破

Qwen 3.5-Plus的反馈速度与理解深度令人意外。仅经过6.3秒的“思考”,它便完成对草图的解构,识别出“左侧列表+右上饼图+右下表格”的结构。

阿里千问3.5-Plus重磅开源:原生多模态、性能倒挂、价格屠夫,开源大模型迎来王炸级突破

运行其生成的HTML代码,预览效果良好。

阿里千问3.5-Plus重磅开源:原生多模态、性能倒挂、价格屠夫,开源大模型迎来王炸级突破

值得注意的是,虽然草图中饼图在上、表格在下,但模型在生成时自动将其优化为更适合宽屏显示的“左右布局”(图表居中,表格在右)。这表明它并非机械地识别像素,而是基于对页面设计的理解进行优化,提升了用户体验。

四、基于截图对比自动修复Bug

尽管优化后的布局视觉效果更佳,但我们仍希望它严格遵循草图原布局。于是,我们将「手绘草图」与「生成的网页截图」一并提交,并给出模糊指令:“找出两者不同之处并进行修正。”

阿里千问3.5-Plus重磅开源:原生多模态、性能倒挂、价格屠夫,开源大模型迎来王炸级突破 阿里千问3.5-Plus重磅开源:原生多模态、性能倒挂、价格屠夫,开源大模型迎来王炸级突破

模型随即给出了具体的修正方案与代码。再次预览,页面布局已完全回归草图原貌。

阿里千问3.5-Plus重磅开源:原生多模态、性能倒挂、价格屠夫,开源大模型迎来王炸级突破

这意味着,开发者无需详细描述界面问题或Bug细节。只需像日常验收一样,将参考图与结果图交给AI并指出“这不对,按原图改”,AI便能基于视觉理解自动完成代码样式的批量修正。“让视觉编程成为真正的生产力工具”,在此得以体现。

目前看来,Qwen 3.5-Plus堪称一款能真正融入生产流程的Visual Coding开源大模型。

结语

经过上述实测,最大的感受是:Qwen 3.5-Plus正在模糊开源与闭源模型的界限。

过去,获得顶级的推理与多模态能力往往依赖昂贵的闭源API。Qwen 3.5-Plus通过“原生多模态”与“极致MoE架构”打破了这一局面。它向业界证明,顶尖的视觉直觉与逻辑推理并非必须依赖万亿参数的堆砌,也不再是少数巨头的技术护城河。

对于开发者而言,此后仅需极低的成本,便能构建一个“能看懂草图、能自动修Bug”的智能开发助手。

在除夕这个特殊时间点,Qwen 3.5-Plus的发布无疑带来了巨大惊喜。

Qwen 3.5-Plus模型已在ModelScope与HuggingFace平台开源,可供下载与本地部署,也可通过千问App直接体验。


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/archives/21679

(0)
上一篇 2026年2月16日 下午5:48
下一篇 2026年2月17日 上午5:47

相关推荐

  • Meta与博通签下五年AI芯片长约,目标为数十亿人打造个人超级智能

    硅谷传来重磅消息:Meta宣布,与博通的定制AI芯片合作将延续至2029年,初始承诺投入超过 1GW 的算力。 1GW算力规模庞大,相当于满足美国75万户家庭的日常用电需求。但这仅仅是开始。 Meta首席执行官马克·扎克伯格在声明中明确表示:此次合作将助力建设大规模计算基础设施,旨在为数十亿人提供个人超级智能。 这一宣言揭示了扎克伯格的终极愿景:让地球上的每…

    2026年4月15日
    46400
  • ICLR 2026数据泄露事件深度剖析:从API漏洞到AI生成审稿的学术信任危机

    2025年11月27日,全球AI学术圈经历了一场前所未有的信任危机。国际学习表征会议(ICLR)2026的评审系统因OpenReview平台的一个API漏洞,导致超过1万篇投稿论文的评审信息在61分钟内大规模泄露。这一事件不仅暴露了学术评审系统的安全脆弱性,更引发了关于同行评审制度有效性和AI在学术评价中角色的深刻反思。 技术层面的漏洞分析显示,问题根源在于…

    2025年12月4日
    49500
  • 揭秘OpenAI Codex智能体循环:AI如何通过工具调用实现高效软件开发

    刚刚,OpenAI CEO 山姆・奥特曼在社交平台发布推文称:「从下周开始的接下来一个月,我们将会发布很多与 Codex 相关的激动人心的东西。」他尤其强调了网络安全这一主题。 如同奥特曼的许多推文一样,这条预告也引发了网友的广泛讨论: 似乎是响应奥特曼的预告,OpenAI 官方随后发布了一篇技术博客,标题为「揭秘 Codex 智能体循环」,深入剖析了 Co…

    2026年1月24日
    61600
  • 黄仁勋怒批AI末日论:别动不动吓唬人,SaaS也没那么容易死

    黄仁勋怒批AI末日论:别动不动吓唬人,SaaS也没那么容易死 过去一年,AI领域最热门的叙事之一,就是“替代”。从程序员、设计师到SaaS产品乃至整个工作模式,似乎每隔一段时间就有新观点抛出:多少岗位将被淘汰,哪个行业会被彻底重塑。但英伟达CEO黄仁勋显然对这种论调不以为然。 立足事实,别动不动吓唬人 在最近一期《Memos to the President…

    AI产业动态 2026年5月4日
    14900
  • Claude Code之父自曝生产数据:30天259个PR全由AI编写,代码不再是瓶颈

    Claude Code 创始人 Boris Cherny 近期在社交平台 X 上公布了过去一个月使用 Claude Code 的真实生产数据,其规模令人惊讶: 在过去 30 天里,我合并了 259 个 PR —— 共 497 次提交,新增约 4 万行代码,删除约 3.8 万行代码。而且,每一行代码都是由 Claude Code + Opus 4.5 编写的。…

    2025年12月29日
    85800