开源模型TOP5,被中国厂商包圆了

10月,公开数据显示,来自中国的开源大模型已经牢牢占据榜单前五。

开源大模型,进入中国时间。

10月,公开数据显示,来自中国的开源大模型已经牢牢占据榜单前五。

阿里的Qwen系列和DeepSeek,更是从2024年下半年起,就在开源社区构建起越来越深远的影响力。

开源模型TOP5,被中国厂商包圆了

这一结果正在引发热议。有不少网友指出:这种情况确实已经持续了很长一段时间。

比如半年前Llama 4翻车时的梗图,就又被挖了出来:

开源模型TOP5,被中国厂商包圆了

无论是模型质量还是开放程度,这一次,国产模型已经从追赶者,转变为引领潮流的一方。

开源模型TOP5,被中国厂商包圆了

紧跟SOTA闭源模型

更具体的情况,可以在LMArena公开榜单中窥见一二。

在文本排行榜中,顶级闭源模型如GPT-5、Gemini-2.5-pro、Claude-Sonnet-4.5等之后,紧随而来的就是智谱的GLM-4.6和DeepSeek-v3.2。

而Qwen3-max-preview则跻身到了TOP3,不过目前该版本模型并未开源。

开源模型TOP5,被中国厂商包圆了

前端开发排行榜中,国产开源模型更是实现了跟编程SOTA Claude的分庭抗礼,DeepSeek-R1/V3.1、GLM-4.6和Qwen3-Coder都排到了前10。

开源模型TOP5,被中国厂商包圆了

视觉方面,腾讯的Hunyuan-vision-1.5和Qwen3同样紧跟闭源SOTA,位列开源最强。

注:Hunyuan-vision-1.5处于计划开源状态,技术报告和模型权重尚未公布。

开源模型TOP5,被中国厂商包圆了

视频模型方面,开源模型中Wan-v2.2表现最佳。

值得注意的是,在这个领域,国产闭源模型同样表现不俗,Kling-2.5、Seedance-v1-pro、Hailuo-02等都位居榜单前列。

开源模型TOP5,被中国厂商包圆了
开源模型TOP5,被中国厂商包圆了

另一个角度,从HuggingFace的模型下载量和模型趋势上,也可以看出开源模型领域,中国力量越来越活跃、越来越强大了。

在趋势榜中,蚂蚁的Ling-1T、智谱的GLM-4.6,都是当下最受关注的开源模型。

开源模型TOP5,被中国厂商包圆了

最受欢迎模型,依然由DeepSeek-R1担当。

开源模型TOP5,被中国厂商包圆了

下载量方面,Qwen3是下载量最高的模型之一。如果将参数规模具体到百亿级,Qwen3更是领先包括gpt-oss在内的其他开源模型。

开源模型TOP5,被中国厂商包圆了

竞争推动创新,而开源已经被证明,是加速创新的重要力量。

有网友认为:现在,这股推动力来自中国。

开源模型TOP5,被中国厂商包圆了

还有人指出,开源模型领域主导地位的转变,不仅仅关乎谁将引领潮流,更重要的是,这或将重新定义全球创新格局。

开源模型TOP5,被中国厂商包圆了

Llama 5要无了?

Anyway,回到开头那张图片上,中国开源力量对大模型格局的冲击,一个重要的节点是“DeepSeek时刻”。

而Llama 4的翻车,也不能说没有贡献一份力量(doge)。

最近小扎不是终于把OpenAI前CTO Mira的公司联创Andrew Tulloch挖走了嘛,传闻是给了一份35亿美元的offer。

消息一出,又把大家对Llama 5的关注给勾起来了:挖了这么多人,花了这么多钱,Meta超级智能实验室能搞出好东西来吧?

但这边刚期待,就有人冒出来泼冷水:Llama 5无了。

开源模型TOP5,被中国厂商包圆了

爆料人说是Meta的数据集供应方。不过后来他又删掉了这个回复,表示以上并非官方消息,他只是从另一个获得Meta资金的团队那里得到了这个消息。

开源模型TOP5,被中国厂商包圆了

那么,被亚历山大·王动摇了开源决心的小扎,究竟会拿出点什么?

板凳,瓜子,长期准备吧~

参考链接:
[1]https://x.com/burkov/status/1977942735962206666
[2]https://lmarena.ai/

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:http://www.itsolotime.com/archives/4263

(0)
上一篇 2025年10月15日 下午2:41
下一篇 2025年10月16日 上午11:57

相关推荐

  • AI颠覆COBOL帝国:IBM股价单日蒸发310亿美元,创26年最惨纪录

    IBM 成为人工智能领域的最新受害者。 周一,IBM 股价单日暴跌 13.2%,收于 223.35 美元,创下该公司自 2000 年 10 月以来最惨烈的单日跌幅,月内累计跌幅已达 25%。 这场风波的导火索,是 AI 初创公司 Anthropic 发布的一篇博客文章。该文章介绍了其 Claude Code 工具如何自动化处理 COBOL 代码的现代化迁移工…

    2026年2月25日
    15800
  • 快手CroPS:跨视角正样本引擎打破搜索信息茧房,AAAI 2026 Oral成果引领向量检索新范式

    短视频搜索是向量检索在工业界最核心的应用场景之一。然而,当前业界普遍采用的「自强化」训练范式过度依赖历史点击数据,导致系统陷入信息茧房,难以召回潜在相关的新鲜内容。 针对这一问题,快手搜索团队提出了一套全新的检索数据引擎 CroPS(Cross-Perspective Positive Samples)。该方法通过引入用户换 Query 数据、推荐流数据以及…

    2026年1月12日
    14200
  • GDPS 2025:上海张江的具身智能“协同大考”,如何定义机器人产业未来?

    一场具身智能的“终极大考”正在上海张江科学会堂上演。全球具身智能顶级赛事——GDPS 2025拉开帷幕,这场赛事不仅汇聚了智元、宇树等国内头部机器人企业,更吸引了国际参赛队伍,将百大真实场景浓缩为一道道协同考题,从工业搬运、花艺创作到康养护理、灾害救援,全面检验机器人从“赛博推理”走向“物理执行”的能力。 舞台两侧,智元远征A2与灵犀X2机器人联袂亮相,穿着…

    2025年12月13日
    17400
  • 震惊!Gemini 3 Flash幻觉率高达91%:AA-Omniscience基准揭示模型致命缺陷

    在业界对Gemini 3 Flash的一片赞誉声中,AA-Omniscience基准测试的最新结果却令人瞠目结舌:该模型的幻觉率竟高达91%,在所有参与测试的模型中位列倒数。所谓幻觉率,是指模型在应当拒绝回答或承认未知时,却错误生成答案的比例,这一指标直接反映了模型的可靠性与准确性。 在更为全面的LisanBench测试中,Gemini 3 Flash的表现…

    2025年12月19日
    67400
  • 医疗AI新突破:CA-GPT系统在心脏介入手术决策中完胜ChatGPT-5,RAG+DeepSeek架构重塑垂直领域智能化标准

    在通用大模型(LLM)席卷全球的浪潮中,医疗垂直领域始终被视为AI落地的“硬骨头”。虽然ChatGPT在USMLE(美国执业医师资格考试)等标准化测试中表现优异,但在需要精准判断和实时决策的临床场景中,通用大模型的局限性日益凸显。近日,一项由空军军医大学唐都医院李妍教授团队与深圳清华大学研究院朱锐团队联合完成的COMPARE研究在arXiv预印本平台发表,研…

    2025年12月16日
    19900

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注