AI产业动态
-
MiniMax M2.5深度评测:国模编程可用性突破,逻辑与工程能力全面进化
短的结论:向下扎根,向上生长 基本情况: 稀宇的前一代M2.1因技术问题,在逻辑能力上落后于M2。M2.5基本解决了这些问题,能力回归正轨,相比M2的综合性能提升约17%。 不过,部分进步是通过更长的思维链和更深的解空间探索换来的。M2.5的平均Token消耗在测试模型中排第6高,几乎是对手Sonnet的2倍。得益于稀宇充足的算力与可控的成本,M2.5在编程…
-
稀宇MiniMax M2.5深度评测:编程能力突破性提升,逻辑推理稳中有进
短的结论:向下扎根,向上生长 基本情况: 稀宇的前一代M2.1因技术问题,在逻辑能力上落后于M2。M2.5基本解决了这些问题,能力回归正轨。相比M2,M2.5的综合能力提升约17%。 部分进步源于更长的思维链和更深的解空间探索,M2.5的平均Token消耗在测试模型中位列第6,几乎是对手Sonnet的2倍。得益于稀宇充足的算力与可控的成本,M2.5在编程上虽…
-
DeepMind CEO揭秘:后Gemini3时代,谷歌如何用AI仿真环境攻克所有疾病?
Gemini 3 Deep Think 的发布,在业界引发了巨大震动。谷歌这款最前沿的模型,以惊人的速度将聊天机器人推向了新的高度,使其成为一个能力超越普通人、甚至博士水平的强大科研助手。这一切的背后,都离不开一个曾被马斯克、奥特曼等人视为“危险人物”的名字:Demis Hassabis。 从击败围棋世界冠军的AlphaGo,到解决蛋白质折叠难题的Alpha…
-
MiniMax M2.5中文场景实测:准确率提升2.1%,响应速度翻倍,成本效率比优化
MiniMax在春节假期前发布了MiniMax M2.5新版本,官方表示该模型经过数十万个真实复杂环境中的大规模强化学习训练,在编程、工具调用和搜索、办公等生产力场景达到了行业前沿水平。我们对MiniMax M2.5与上一代MiniMax M2.1进行了全面的中文场景对比评测,测试其在准确率、响应时间、token消耗和成本等关键指标上的表现差异。 需要说明的…
-
MiniMax M2.5全面评测:中文场景性能跃升,Agent能力暴涨10.6%,成本效率比显著优化
MiniMax在春节假期前发布了MiniMax M2.5新版本。官方表示,该模型经过数十万个真实复杂环境中的大规模强化学习训练,在编程、工具调用和搜索、办公等生产力场景达到了行业前沿水平。我们对MiniMax M2.5与上一代MiniMax M2.1进行了全面的中文场景对比评测,测试其在准确率、响应时间、token消耗和成本等关键指标上的表现差异。 本次评测…
-
MiniMax M2.5:230B参数MoE架构仅激活10B,开源模型性能逼近Claude Opus,成本骤降90%
MiniMax推出了新一代开源模型M2.5,官方称其为“为现实世界生产力设计的开源前沿模型”。 性能数据:逼近Claude Opus 关键性能指标显示M2.5已跻身顶级模型行列:* SWE-Bench Verified 80.2%:与Claude Opus 4.6持平* BrowseComp 76.3%:行业领先的搜索和工具使用能力* Multi-SWE-B…
-
国产算力新突破:摩尔线程S5000以1000 TFLOPS算力与Day0适配GLM-5,硬撼H100逼近Blackwell
在国产AI算力领域,硬件性能是基础,而软硬协同的生态适配能力才是决定胜负的关键。随着智谱AI发布最新一代旗舰模型GLM-5,这款在编码能力上位居全球开源第一、总榜第四的模型迅速引发行业关注。 与此同时,摩尔线程宣布其AI旗舰计算卡MTT S5000实现了对GLM-5的Day0“发布即适配”,并首次披露了关键性能参数:在FP8精度下,单卡AI算力高达1000 …
-
MiniMax-M2.5震撼上线:国产AI模型春节档激战,网页制作与编程能力全面升级
一句话做“黄金矿工”游戏、生成精美公司网站。 智东西2月12日消息,春节将至,国产AI大模型之战愈发火爆。短短1天多时间,DeepSeek、智谱、字节等多家厂商模型密集更新,MiniMax-M2.5正式上线,其重点提升了Agent和编程能力。 ▲MiniMax-M2.5已可选 MiniMax AI相关负责人在X平台上发文称,他想尽快发布M2.5,已经迫不及待…
-
中国AI视频双雄并起:Seedance 2.0与Vidu Q3组团席卷全球
在AI视频创作领域,Seedance 2.0的爆火不是偶然。这一次真正“破圈”,很大程度上源于它所具备的“导演思维”——剧本驱动、分镜清晰、节奏精准。它让人们意识到,一个好的AI视频更需要创意调度。而过去,创作者在AI视频中最难掌握的两个要素,恰恰就是理解故事结构与镜头语言。 与此同时,另一款国产视频生成模型生数科技的Vidu Q3,也在创作者社群中走红,并…
-
华为MindScale算法架构升级:行业Agent实现工作流自进化与提示词自动化,KV Cache优化提升5.7倍效率
华为MindScale算法架构升级:行业Agent实现工作流自进化与提示词自动化,KV Cache优化提升5.7倍效率 在大模型的多种应用形态中,执行专业功能的行业Agent,无疑是提升生产效率、实现价值创造的利器。 然而,千行百业包含着大量的私域知识、专家经验和工具使用逻辑,使得智能体的行业应用构建存在各类门槛。 为了提升开发效率,业界提出了诸如Skill…
