开源大模型

  • MiniMax M2.5:230B参数MoE架构仅激活10B,开源模型性能逼近Claude Opus,成本骤降90%

    MiniMax推出了新一代开源模型M2.5,官方称其为“为现实世界生产力设计的开源前沿模型”。 性能数据:逼近Claude Opus 关键性能指标显示M2.5已跻身顶级模型行列:* SWE-Bench Verified 80.2%:与Claude Opus 4.6持平* BrowseComp 76.3%:行业领先的搜索和工具使用能力* Multi-SWE-B…

    2026年2月13日
    1.2K00
  • GLM-5:开源AI新标杆,24小时自主编程打造GBA模拟器

    GLM-5:开源AI新标杆,24小时自主编程打造GBA模拟器 当看到GLM-5正式发布后的能力,才惊觉前几天神秘模型Pony Alpha的热度还是有点保守了。 因为这一次,GLM-5直接把开源AI也拽进了长任务时代。 瞧,GLM-5直接身兼数职,自己连续跑代码超过24小时,完成700次工具调用、800次上下文切换之后…… 它直接用JavaScript,从零手…

    2026年2月12日
    46800
  • 国产AI大模型GLM-5横空出世:开源对标Claude Opus,10分钟傻瓜化部署Agent任务

    前两天,海外科技社区仿佛集体化身侦探,陷入了一场热烈的猜谜游戏。 这一切源于一个名为 Pony Alpha 的匿名模型,它没有任何发布会,也没有任何公司认领,却凭借几个简单的 API 接口和惊艳的生成质量,在各大评测榜单上横空出世,迅速引爆了 X(原 Twitter)和 Reddit 等技术社区。 全球模型聚合平台 OpenRouter 于 2月6日首次公开…

    2026年2月12日
    78000
  • AI周报:阿里通义语音模型升级、腾讯开源2B小模型、Qwen3-VL多模态检索新突破

    1月5日 【闭源】 阿里通义发布语音合成模型 CosyVoice-v3-flash,新增24个音色以覆盖多元场景需求。新增音色包括:* 方言类:龙嘉怡、龙老铁* 出海营销类* 诗词朗诵类:龙飞* 语音助手类:龙小淳、龙小夏、YUMI* 社交陪伴类:龙橙、龙泽、龙哲、龙颜、龙星、龙天、龙婉、龙嫣、龙菲菲、龙浩* 有声书类:龙三叔、龙媛、龙悦、龙修、龙楠* 新闻…

    2026年1月12日
    52900
  • 从支线项目到行业颠覆者:DeepSeek等8大AI产品的意外崛起之路

    从支线项目到行业颠覆者:DeepSeek等8大AI产品的意外崛起之路 这些改变世界的产品,最初居然都是不被当回事儿的支线项目 (side project) ? 包括但不限于: DeepSeek:幻方量化的支线项目 Qwen:阿里的支线项目 Claude Code:Anthropic的支线项目 ChatGPT:OpenAI的支线项目 PyTorch:Meta的…

    2026年1月11日
    31200
  • 英伟达Nemotron 3:从硬件霸主到开源颠覆者的战略突袭

    2025年底,AI产业的竞争格局正在发生深刻变革。作为长期占据硬件生态顶端的英伟达,在12月15日正式宣布推出Nemotron 3开源模型家族(Nano/Super/Ultra),其中Nano版本已率先发布,Super和Ultra版本则规划于2026年上半年面世。这一举动标志着英伟达不再满足于仅仅扮演“卖铲人”的角色,而是直接下场参与“挖矿”竞赛,其战略意图…

    2025年12月16日
    32900
  • 效率革命:微博VibeThinker以15亿参数重塑大模型竞争格局

    在AI行业普遍陷入“参数崇拜”的背景下,微博AI近期发布的VibeThinker开源大模型,以仅15亿参数的轻量级架构,在国际顶级数学竞赛基准测试中击败了参数量高达6710亿的DeepSeek R1模型,这一突破性成果不仅挑战了传统技术评价标准,更可能引发AI产业从“规模竞赛”向“效率革命”的深刻转型。 ### 技术范式突破:小模型如何实现复杂推理能力 长期…

    2025年11月18日
    39200
  • Kimi K2 Thinking开源引爆AI界:超越GPT-5的300步工具调用模型实战指南

    Kimi 最近开源了其思考模型:Kimi K2 Thinking。根据官方介绍,该模型具备“边思考,边使用工具”的能力,能够自主执行高达 300 步的工具调用流程,以解决复杂问题。在被称为“人类终极考试”的高难度推理与通用智力测试中,其表现超越了 GPT-5,达到了当前的最先进水平。 若想在 Kimi 官网体验此能力,可直接在 kimi.com 开启“长思考…

    2025年11月17日
    75400
  • 中国开源大模型引领全球AI应用创新:从Cursor到Windsurf的“反向技术输出”现象深度解析

    近期,全球AI领域出现了一个引人注目的现象:美国顶流AI编程应用Cursor和Windsurf相继发布的新模型,被多方证据指向其底层技术可能基于中国的开源大模型。这一发现不仅在国际技术社区引发热议,更揭示了中国在人工智能开源生态建设方面取得的实质性突破。 **技术溯源:从“中文输出”到模型架构的线索** Cursor最新发布的Composer-1模型被用户发…

    2025年11月2日
    42900
  • 全球AI编程新纪元:中国开源大模型如何重塑西方科技产品格局

    近期,Cursor和Cognition两家美国科技公司相继发布新一代AI编程模型Composer和SWE-1.5,引发业界广泛关注。然而,这些模型在推理过程中频繁使用中文的现象,以及其技术特征与中国开源模型的惊人相似性,揭示了全球AI产业格局正在发生的深刻变革。 Cursor发布的Composer模型作为其首个自研代码模型,采用强化学习训练的大型MoE架构,…

    2025年11月1日
    35700