开源模型 - 鲸林向海

小米开源MiMo-V2-Flash实测：零成本大模型在长上下文与推理效率间的新平衡

小米近期开源了MiMo-V2-Flash模型，这是其在大模型领域推出的开源产品。官方强调该模型在长上下文建模能力与推理效率之间实现了新的平衡。我们对MiMo-V2-Flash的思考模式（think）和非思考模式进行了全面评测，测试其在准确率、响应时间、token消耗等关键指标上的表现。 MiMo-V2-Flash-think版本表现：* 测试题数：约1.5万…

2025年12月21日

892001

AI产业动态

Transformer先驱的回归：8B小模型Rnj-1如何挑战AI规模竞赛的迷思

在当今AI领域被千亿参数巨兽主导的时代，Essential AI Labs推出的80亿参数开源模型Rnj-1如同一股清流，不仅是对当前AI发展路径的深刻反思，更是对轻量化、开放式AI生态的有力探索。这一由Transformer原始论文作者Ashish Vaswani和Niki Parmar主导的项目，标志着AI研究正从单纯的规模扩张转向更注重效率、可及性和技…

2025年12月19日

386000

大模型评测

GPT-5.2-high实测：速度飙升69%但准确率下滑，成本效率面临开源模型挑战

OpenAI近期发布了GPT-5.2版本，作为GPT-5系列的最新迭代。我们对GPT-5.2-high（思考模式）与上一版本GPT-5.1-high进行了全面对比评测，测试其在准确率、响应时间、token消耗和成本等关键指标上的表现差异。 GPT-5.2-high版本表现：* 测试题数：约1.5万* 总分（准确率）：67.4%* 平均耗时（每次调用）：36s…

2025年12月16日

383000

AI产业动态

AI周报：智谱GLM-4.6V革新视觉Agent，谷歌Gemini 2.5与OpenAI GPT-5.2齐发，多模态与智能体技术迎来爆发期

12月8日【开源】智谱AI发布GLM-4.6V系列多模态大模型，包含GLM-4.6V（106B）云端版和GLM-4.6V-Flash（9B）轻量版。该系列模型支持128k超长上下文，在同参数规模下实现了视觉理解SOTA性能。其最大亮点在于首次将Function Call能力原生融入视觉模型架构，打通了从“视觉感知”到“可执行行动”的完整链路，为多模态Ag…

2025年12月15日

429000

AI产业动态

多模型路由时代：从OpenRouter《State of AI》报告看AI使用格局与Agent化趋势

一、报告背景：OpenRouter 在整个 AI 版图中的位置 1.1 OpenRouter 是谁？这份报告在看什么？ OpenRouter 本质上是一个多模型路由层（Model Router / Gateway）：对上：开发者、应用只需要对接一个 API；对下：OpenRouter 接入了 300+ 模型、60+ 提供方，覆盖了主流闭源（Op…

2025年12月12日

557000

AI产业动态

从TNT到AutoGLM：开源GUI Agent如何重塑人机交互与隐私边界

在科技发展的长河中，某些超前的构想往往因时代局限而被视为激进的赌博，却在未来某个节点以更成熟的形式重新定义行业。七年前，锤子科技推出的TNT（Touch & Talk）系统，试图通过触控与语音结合的方式“重新定义个人电脑”，却因当时AI技术的不成熟而沦为科技圈的“永生梗”。然而，在2025年的今天，随着大模型与智能体技术的爆发，我们惊讶地发现：TNT…

2025年12月10日

366000

AI产业动态

INTELLECT-3：开源RL技术栈引领大规模强化学习新范式

近日，Prime Intellect正式发布了INTELLECT-3模型，这是一款拥有106B参数的混合专家（Mixture-of-Experts）架构模型，基于其自研的强化学习技术栈进行训练。该模型在数学、代码、科学和推理等多个基准测试中取得了同规模模型中的最佳表现，甚至超越了部分参数更大的前沿模型。更重要的是，Prime Intellect将完整的训练流…

2025年12月10日

373000

AI产业动态

2025人工智能年度盘点：开源竞速、Agent崛起与产业融合的共生纪元

2025年，人工智能领域迎来了前所未有的技术爆发与产业融合。这一年，开源与闭源模型的双线竞速、AI Agent的规模化应用、世界模型的商业化落地以及具身智能的全面渗透，共同勾勒出一幅“共生无界”的智能未来图景。 **开源与闭源的边界消融** 2025年初，DeepSeek-R1的横空出世为全年技术叙事定下基调。这款模型不仅在参数规模上实现突破，更在推理效率、…

2025年12月10日

329000

AI产业动态

AI模型周报：阶跃星辰GUI Agent破纪录，Mistral 3系列开源引领多模态浪潮

12月1日【开源】阶跃星辰开源GELab-Zero阶跃星辰开源了GELab-Zero，首次将GUI Agent模型与完整的配套基础设施同步开放，支持一键部署。其4B参数的GUI Agent模型在手机端、电脑端等多个GUI基准测试中全面刷新了同尺寸模型的性能纪录，取得了SOTA成绩。此外，阶跃还开源了基于真实业务场景的自建评测标准AndroidDaily，旨…

2025年12月8日

527000

AI产业动态

2025年AI大分流：100万亿Token数据揭示开源崛起、推理为王与亚洲时刻

100万亿Token实证：2025年AI大分流全景图 2025年，人工智能领域迎来一个结构性转折点。OpenRouter与a16z联合发布了一份基于真实算力消耗的深度研究报告，通过分析过去一年处理的超过100万亿个Token的元数据，揭示了当前AI发展的核心趋势与反直觉洞察。这份报告摒弃了传统的学术基准或宣称的用户数，从全球300多个模型、60多个提供方的实…

2025年12月6日

358000