Kimi - 鲸林向海

Kimi重磅发布《Attention Residuals》：颠覆十年残差连接，用同样算力实现1.25倍效果提升

注意力残差：对残差连接的结构性改进引言：一个基础性的问题现代大型语言模型普遍采用深度神经网络架构，信息从输入层开始，逐层向上传递并接受加工，最终产生输出。然而，随着网络层数的增加，训练过程面临一个根本性挑战：梯度信号在反向传播过程中，经过数十甚至上百层的传递后，可能严重衰减或消失，导致底层参数难以得到有效更新。 2015年，何恺明团队在《Deep Res…

4小时前

27000

AI产业动态

Kimi-K2.5-Thinking实测：推理效率提升33%，Agent能力意外滑坡，开源模型新标杆？

月之暗面发布了 Kimi-K2.5-Thinking 新版本，官方称其为“Kimi迄今最智能的模型”，在Agent、代码、图像、视频及一系列通用智能任务上取得了开源state-of-the-art表现。我们对新旧两个版本（Kimi-K2.5-Thinking、Kimi-K2-Thinking）进行了全面的对比评测，测试其在准确率、响应时间、token消耗和成…

2026年1月28日

741000

AI产业动态

Kimi神秘模型Kiwi-do现身竞技场：融资35亿后，多模态K2-VL即将登场？

克雷西发自凹非寺量子位 | 公众号 QbitAI 融资35亿后，Kimi的新模型紧跟着就要来了？！大模型竞技场上，一个名叫Kiwi-do 的神秘模型悄然出现。发现这个新模型的推特网友询问了模型的身份，结果模型自报家门，表示自己来自月之暗面Kimi，训练数据截止到2025年1月。另有网友表示，Kiwi-do表现出了一些有趣的结果，尤其是在竞技场当中…

2026年1月5日

190000