开源模型 - 鲸林向海

昆仑天工SkyReels-V3开源：多模态视频生成新标杆，开启AI创作新纪元

昆仑天工开源SkyReels-V3：多模态视频生成模型实现技术突破近日，昆仑天工正式宣布开源其多模态视频生成模型 SkyReels-V3。该模型在文生视频、图生视频、视频延长及虚拟形象生成等多个维度展现出强大能力，致力于解决AI生成视频内容在真实性、连贯性与物理合理性方面的长期挑战。多模态生成能力实测 SkyReels-V3支持从图像生成动态视频。以下测…

2026年1月29日

186000

AI产业动态

Kimi-K2.5-Thinking实测：推理效率提升33%，Agent能力意外滑坡，开源模型新标杆？

月之暗面发布了 Kimi-K2.5-Thinking 新版本，官方称其为“Kimi迄今最智能的模型”，在Agent、代码、图像、视频及一系列通用智能任务上取得了开源state-of-the-art表现。我们对新旧两个版本（Kimi-K2.5-Thinking、Kimi-K2-Thinking）进行了全面的对比评测，测试其在准确率、响应时间、token消耗和成…

2026年1月28日

761000

大模型评测

国产具身智能新突破：千寻Spirit v1.5开源即登顶全球真机评测榜首

全球榜单中唯一成功率超过50%的模型。智东西1月12日报道，今日，千寻智能正式开源自研VLA基础模型Spirit v1.5。就在前一天，该模型在全球具身智能模型评测平台RoboChallenge的综合评测中斩获第一。 RoboChallenge的基准测试包含30项任务，如摆放薯条、寻找固定颜色物体、贴胶带等。Spirit v1.5的综合得分为66.09分，…

2026年1月12日

183000

AI产业动态

a16z创始人Marc Andreessen深度解读：中国AI崛起，Kimi推理能力媲美GPT-5，DeepSeek成全球超新星

1月8日，硅谷传奇风险投资家、a16z联合创始人Marc Andreessen以一场长达80分钟的播客访谈，发表了其对人工智能革命的深度见解。这位曾以《软件正在吞噬世界》一文定义时代的投资人，以其一贯的宏观视角，剖析了全球AI格局的现状与未来。访谈中，Marc Andreessen首先对AI革命的进程给出了极为乐观的评价。他认为，AI的传播速度远超互联网，…

2026年1月9日

300000

大模型推理

DeepSeek R1爆更86页论文：开源模型如何用强化学习实现推理能力突破

R1论文暴涨至86页！DeepSeek向世界证明：开源不仅能追平闭源，还能教闭源做事！全网震撼！两天前，DeepSeek悄无声息地将R1的论文从原来的22页大幅更新至86页。这篇全新的论文证明，仅通过强化学习就能显著提升AI的推理能力。DeepSeek似乎在憋大招，甚至有网友推测，这种纯强化学习方法或许会出现在未来的R2版本中。此次更新，将原始论文升级为…

2026年1月8日

222000

AI产业动态

英伟达CES 2026技术盛宴：Rubin架构、开源AI与物理智能革命

2026，黄仁勋开年第一讲来了！ 5个小时前，英伟达创始人黄仁勋现身拉斯维加斯的CES 2026现场。3000名观众坐满礼堂，庭院里还有2000人在观看；全球数百万人通过直播欣赏这场新年技术盛宴。这是我们今年的第一场主题演讲，我们得先把“蜘蛛网”清理掉。黄仁勋的演讲长达90分钟，用他自己的话说，今天要“塞进去”的内容大概有15公斤那么多。他首先开门见山…

2026年1月6日

236000

大模型工程

北京版幻方开源SOTA代码大模型IQuest-Coder-V1：40B参数性能超Opus-4.5/GPT-5.2，单张3090可运行

IQuest-Coder-V1：性能超群的代码大模型近期，一个名为 IQuest-Coder-V1 的代码大模型系列在科技领域引发广泛关注。在最新的SWE-Bench Verified榜单中，其40B参数版本取得了81.4%的成绩，表现超越了Claude Opus-4.5与GPT-5.2等模型。除了基准测试成绩，其实际代码生成能力同样引人注目。例如，当…

2026年1月2日

282001

AI产业动态

AI模型周报：通义千问、MiniMax、智谱AI等巨头齐发新版，图像编辑与编程能力全面升级

12月23日【闭源】通义千问发布图像编辑模型快照通义千问团队发布了 qwen-image-edit-plus-2025-12-15 图像编辑模型的最新快照。该版本在角色一致性、工业设计能力和几何推理能力上相较前代实现显著提升，优化了编辑后图片与原图在空间布局、纹理和风格上的匹配度，编辑效果更为精准细腻，旨在为专业图像处理提供更强大的工具支持。【开源】Mi…

2025年12月29日

245000

AI产业动态

腾讯AI战略升级：顶尖人才引领，开源基建与模型协同加速智能体落地

在外界感知中，腾讯在 AI 领域的动作更多被贴上稳健甚至克制的标签。但在 2025 年的尾声，从人才引进到产品迭代再到组织变革，一系列密集信号的发出，也侧面表明这个巨头正在按下加速键。 12 月 17 日，机器之心报道证实，前 OpenAI 研究员、清华校友姚顺雨（Vinces Yao）正式加入腾讯，出任「CEO / 总裁办公室」首席 AI 科学家，并直接向…

2025年12月25日

211000

大模型评测

MiniMax-M2.1实测：性能提升4%但响应时间翻倍，成本增加21.6%的深度评测

MiniMax新发布了M2.1版本，相比此前的M2版本，在多个维度实现了性能变化。我们对这两个版本进行了全面的对比评测，测试其在准确率、响应时间、token消耗和成本等关键指标上的表现差异。 MiniMax-M2.1版本表现：* 测试题数：约1.5万* 总分（准确率）：63.6%* 平均耗时（每次调用）：111s* 平均token（每次调用消耗的token）…

2025年12月24日

1.6K000