阿里藏不住了!Qwen3.7预览版突然上线,国产模型登顶Arena双榜

阿里藏不住了!Qwen3.7预览版突然上线,国产模型登顶Arena双榜

阿里这保密工作做得也太到位了,一不留神,Qwen 3.7预览版就悄然上线了!

Arena(原大模型竞技场)官方𝕏账号正式公布了Qwen3.7-Max-Preview和Qwen3.7-Plus-Preview的最新成绩。

在文本领域,Qwen3.7-Max-Preview位列第13名,这直接推动阿里巴巴(实验室)的整体排名跃升至第6位。

它也是国产模型中排名最高的选手。

在视觉领域,Qwen3.7-Plus-Preview则拿下第16名,让阿里巴巴的总排名攀升至第5。

同样,它在排行榜上也是国产模型的冠军。

Qwen官方账号直接表态:“我们已经迫不及待要发布Qwen3.7系列了!”

阿里藏不住了!Qwen3.7预览版突然上线,国产模型登顶Arena双榜

不过,等等,我记得4月底才刚发布了Qwen3.6-Max-Preview?

Qwen3.6-Max还处在预览版阶段,Qwen3.7-Max预览版就已经端上桌了……这让人一时搞不清,究竟是正式版放出的节奏太慢,还是版本迭代的速度太快?

不管怎样,Qwen啊,这两款模型的正式版到底什么时候才能面世?

真是让人着急。

Qwen3.7系列预览版来了!

今早一觉醒来,就发现Arena已经公布了Qwen3.7预览版的最新表现。

Qwen3.7-Max-Preview在文本领域整体排名第13。

排在前面的,分别是Claude Opus4.6和4.7系列、Gemini-3.1/3 Pro系列、GPT-5.4/5.4-High等模型。

可以看到,Qwen3.7-Max-Preview也是Arena文本领域榜单上,唯一跻身全球前十五的中国模型。

阿里藏不住了!Qwen3.7预览版突然上线,国产模型登顶Arena双榜

同时,它在多个细分领域表现强劲,以下赛道均进入全球前十:

  • 数学:第7
  • 专家提示:第9
  • 软件/IT:第9
  • Coding:第10

阿里藏不住了!Qwen3.7预览版突然上线,国产模型登顶Arena双榜

而同期公布的另一组成绩——Qwen3.7-Plus-Preview——在视觉领域的表现同样可圈可点。

该领域内排名第18,使阿里巴巴的总排名上升至第5。

同样,它也是视觉领域中唯一上榜的中国模型。

阿里藏不住了!Qwen3.7预览版突然上线,国产模型登顶Arena双榜

此外,Arena还公布了专家竞技场的成绩。

在专家竞技场中,Qwen3.7-Max-Preview在仅限专家提示方面排名第9位。

这个榜单上还有另一个中国模型,小米的Mimo v2.5 Pro,位列第7。

阿里藏不住了!Qwen3.7预览版突然上线,国产模型登顶Arena双榜

我们还能说什么呢?

只能说:快点把正式版放出来!快点开源!我要亲自上手体验!

阿里藏不住了!Qwen3.7预览版突然上线,国产模型登顶Arena双榜

进入Qwen3时间后,模型迭代明显提速

有网友表示,Qwen发布新模型的速度让人目不暇接,人们还没来得及讨论完一个模型,下一个模型的预告片就已经自动播放了。

这并非错觉,我们梳理了Qwen发布迭代的时间线,发现事实确实如此。

(注:表格重点收录主要里程碑版本,实际还有更多细分尺寸和专项模型,如Coder、VL、Omni等)

阿里藏不住了!Qwen3.7预览版突然上线,国产模型登顶Arena双榜

看看这张表格,早期(2023-2024年),Qwen的发布节奏还算随大流,大约每4-6个月推出一款更新的大版本。

转折点出现在Qwen3系列。

2025年发布的Qwen3包括dense模型和MoE模型,参数规模从0.6B到235B不等,支持复杂推理和快速响应的模式。

其中,Thinking模式(支持复杂推理)主要面向复杂推理、长链路决策、Agent任务;Non-Thinking模式(快速响应)则偏向低延迟、快速响应。

迄今为止发布的Qwen3.7预览版,仍属于这一家族的最新成果。

我们注意到,Qwen3及以后,模型迭代节奏明显提速,大版本间隔缩短至2-3个月一次

尤其是进入2026年,Qwen几乎每个月都有新动作,从3.5到3.6再到3.7,版本号更新非常迅速。

阿里藏不住了!Qwen3.7预览版突然上线,国产模型登顶Arena双榜

而且普遍节奏是Preview版本先上线——社区先测/开发者先用——正式版再跟进。

这在一定程度上反映出,阿里Qwen团队已进入快速实验、高频交付的阶段。

还记得Qwen前负责人林俊旸离开时发布的那条推特:

Qwen的兄弟们,按原来安排继续干,没问题的。

他离开时,Qwen处于3.5时代,与DeepSeek一样,是国产开源界的标杆模型。

无论是延续以往的作风,还是在新负责人的带领下,后续的Qwen3.5、3.7版本,确实依然在一步一步更快,也更好。

阿里藏不住了!Qwen3.7预览版突然上线,国产模型登顶Arena双榜

曾经,我们用几年、一年时间等待一款新手机的升级;如今,我们用几个月、甚至几周,就目睹一个模型从稚嫩走向强大。

有人欢呼,有人焦虑,有人彻夜调试,只为追上那条不断向前狂奔的智能曲线。

技术从不等待任何人。

它像一条奔腾的河流,而我们正站在岸边,既是见证者,也是参与者。

参考链接:
[1]https://x.com/Alibaba_Qwen/status/2056403591464984753
[2]https://x.com/arena/status/2056400044862111757


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/archives/35324

(0)
上一篇 9小时前
下一篇 9小时前

相关推荐

  • FeRA:从频域第一性原理出发,实现扩散模型动态参数高效微调

    在大模型时代,参数高效微调(PEFT)已成为将Stable Diffusion、Flux等大规模扩散模型迁移至下游任务的标准范式。从LoRA到DoRA,社区不断探索如何用更少的参数实现更好的适配。然而,现有微调方法大多采用“静态”策略:无论模型处于去噪过程的哪个阶段,适配器的参数都是固定不变的。这种“一刀切”的方式忽略了扩散生成过程内在的时序物理规律,导致模…

    AI产业动态 2025年12月12日
    34300
  • T-MAN:NPU大模型推理的革命性方案,解码速度提升3.1倍,能效比领先84%

    关键词:T-MAN、查找表 、 低比特量化 、NPU 推理 、端到端优化 当大模型遇上手机 NPU,推理速度反而比 CPU 还慢?USTC、微软研究院、清华等研究团队提出统一查找表方案 ,同时解决速度、能耗与精度三大难题。 近年来,大语言模型(LLM)正逐步“入住”我们的手机、电脑等消费设备。无论是苹果的 Apple Intelligence、谷歌的 Gem…

    2026年1月14日
    47400
  • 华为天才少年创业:全球首个虚实融合实时交互视频模型X1,让童年幻想“滚球兽”走进现实

    还记得童年的那个愿望吗? 随着《数码宝贝》进化曲的响起,屏幕前的你我或许都曾幻想过:要是那只从数码蛋中破壳而出的滚球兽,真的可以从电视屏幕那端跳出来,就好了。 彼时,我们只能将这种天马行空的「美梦」寄希望于「次元裂缝」的开启。再后来,增强现实(AR)技术曾一度带来了希望,但几经潮起潮落,结果仍停留在「预先制作的内容叠加」层面,数字角色无法真正感知环境。 而现…

    2026年2月9日
    49000
  • AlphaFold:从蛋白质折叠到生命系统建模的AI革命

    蛋白质结构预测曾是结构生物学领域长达半个世纪的难题,传统实验方法如X射线晶体学和冷冻电镜不仅耗时漫长(通常需要数月甚至数年),且成本高昂(单次实验可达数百万美元),严重制约了生命科学研究的进展。这一瓶颈在2020年被DeepMind开发的AlphaFold 2彻底打破——该模型仅凭氨基酸序列就能在几分钟内预测出高精度的蛋白质三维结构,其预测结果与实验数据的误…

    2025年11月27日
    59200
  • TCDiff++:突破群体舞蹈生成瓶颈,端到端模型实现虚拟群舞新高度

    在元宇宙与数字人技术快速发展的今天,群体舞蹈生成已成为虚拟演唱会、数字人集体表演等场景的核心需求。然而,现有技术在多人生成、动作协调和长序列稳定性方面面临严峻挑战。近期,由南京理工大学、清华大学和南京大学联合研发的端到端模型TCDiff++,通过创新性的架构设计,成功突破了这些技术壁垒,为高质量、长时序的群体舞蹈自动生成提供了完整解决方案。 当前群体舞蹈生成…

    2025年11月27日
    34600