开源大模型

MiniMax M2.5：230B参数MoE架构仅激活10B，开源模型性能逼近Claude Opus，成本骤降90%

MiniMax推出了新一代开源模型M2.5，官方称其为“为现实世界生产力设计的开源前沿模型”。性能数据：逼近Claude Opus 关键性能指标显示M2.5已跻身顶级模型行列：* SWE-Bench Verified 80.2%：与Claude Opus 4.6持平* BrowseComp 76.3%：行业领先的搜索和工具使用能力* Multi-SWE-B…

2026年2月13日

1.2K000

AI产业动态

GLM-5：开源AI新标杆，24小时自主编程打造GBA模拟器

GLM-5：开源AI新标杆，24小时自主编程打造GBA模拟器当看到GLM-5正式发布后的能力，才惊觉前几天神秘模型Pony Alpha的热度还是有点保守了。因为这一次，GLM-5直接把开源AI也拽进了长任务时代。瞧，GLM-5直接身兼数职，自己连续跑代码超过24小时，完成700次工具调用、800次上下文切换之后…… 它直接用JavaScript，从零手…

2026年2月12日

468000

AI产业动态

国产AI大模型GLM-5横空出世：开源对标Claude Opus，10分钟傻瓜化部署Agent任务

前两天，海外科技社区仿佛集体化身侦探，陷入了一场热烈的猜谜游戏。这一切源于一个名为 Pony Alpha 的匿名模型，它没有任何发布会，也没有任何公司认领，却凭借几个简单的 API 接口和惊艳的生成质量，在各大评测榜单上横空出世，迅速引爆了 X（原 Twitter）和 Reddit 等技术社区。全球模型聚合平台 OpenRouter 于 2月6日首次公开…

2026年2月12日

780000

AI产业动态

AI周报：阿里通义语音模型升级、腾讯开源2B小模型、Qwen3-VL多模态检索新突破

1月5日【闭源】阿里通义发布语音合成模型 CosyVoice-v3-flash，新增24个音色以覆盖多元场景需求。新增音色包括：* 方言类：龙嘉怡、龙老铁* 出海营销类* 诗词朗诵类：龙飞* 语音助手类：龙小淳、龙小夏、YUMI* 社交陪伴类：龙橙、龙泽、龙哲、龙颜、龙星、龙天、龙婉、龙嫣、龙菲菲、龙浩* 有声书类：龙三叔、龙媛、龙悦、龙修、龙楠* 新闻…

2026年1月12日

529000

AI产业动态

从支线项目到行业颠覆者：DeepSeek等8大AI产品的意外崛起之路

从支线项目到行业颠覆者：DeepSeek等8大AI产品的意外崛起之路这些改变世界的产品，最初居然都是不被当回事儿的支线项目（side project）？包括但不限于： DeepSeek：幻方量化的支线项目 Qwen：阿里的支线项目 Claude Code：Anthropic的支线项目 ChatGPT：OpenAI的支线项目 PyTorch：Meta的…

2026年1月11日

312000

AI产业动态

英伟达Nemotron 3：从硬件霸主到开源颠覆者的战略突袭

2025年底，AI产业的竞争格局正在发生深刻变革。作为长期占据硬件生态顶端的英伟达，在12月15日正式宣布推出Nemotron 3开源模型家族（Nano/Super/Ultra），其中Nano版本已率先发布，Super和Ultra版本则规划于2026年上半年面世。这一举动标志着英伟达不再满足于仅仅扮演“卖铲人”的角色，而是直接下场参与“挖矿”竞赛，其战略意图…

2025年12月16日

329000

AI产业动态

效率革命：微博VibeThinker以15亿参数重塑大模型竞争格局

在AI行业普遍陷入“参数崇拜”的背景下，微博AI近期发布的VibeThinker开源大模型，以仅15亿参数的轻量级架构，在国际顶级数学竞赛基准测试中击败了参数量高达6710亿的DeepSeek R1模型，这一突破性成果不仅挑战了传统技术评价标准，更可能引发AI产业从“规模竞赛”向“效率革命”的深刻转型。 ### 技术范式突破：小模型如何实现复杂推理能力长期…

2025年11月18日

392000

开源项目

Kimi K2 Thinking开源引爆AI界：超越GPT-5的300步工具调用模型实战指南

Kimi 最近开源了其思考模型：Kimi K2 Thinking。根据官方介绍，该模型具备“边思考，边使用工具”的能力，能够自主执行高达 300 步的工具调用流程，以解决复杂问题。在被称为“人类终极考试”的高难度推理与通用智力测试中，其表现超越了 GPT-5，达到了当前的最先进水平。若想在 Kimi 官网体验此能力，可直接在 kimi.com 开启“长思考…

2025年11月17日

754000

AI产业动态

中国开源大模型引领全球AI应用创新：从Cursor到Windsurf的“反向技术输出”现象深度解析

近期，全球AI领域出现了一个引人注目的现象：美国顶流AI编程应用Cursor和Windsurf相继发布的新模型，被多方证据指向其底层技术可能基于中国的开源大模型。这一发现不仅在国际技术社区引发热议，更揭示了中国在人工智能开源生态建设方面取得的实质性突破。 **技术溯源：从“中文输出”到模型架构的线索** Cursor最新发布的Composer-1模型被用户发…

2025年11月2日

429000

AI产业动态

全球AI编程新纪元：中国开源大模型如何重塑西方科技产品格局

近期，Cursor和Cognition两家美国科技公司相继发布新一代AI编程模型Composer和SWE-1.5，引发业界广泛关注。然而，这些模型在推理过程中频繁使用中文的现象，以及其技术特征与中国开源模型的惊人相似性，揭示了全球AI产业格局正在发生的深刻变革。 Cursor发布的Composer模型作为其首个自研代码模型，采用强化学习训练的大型MoE架构，…

2025年11月1日

357000