Cursor套壳Kimi风波再起：Composer 2技术报告自证“有技术地套”，网友却不买账

2026年3月27日上午10:34 • AI产业动态 • 阅读 490

Cursor套壳Kimi的争议仍在继续。

近日，Cursor发布了Composer 2的技术报告，试图证明其并非简单套用，而是进行了有技术含量的、循序渐进的研发工作。

报告强调，其方法核心仍是此前提及的预训练与强化学习相结合的技术路线。

与此前不同的是，Cursor在报告中明确标注了基础模型来源为Kimi K2.5。

这一迅速且明确的署名行为，显示出其态度转变，甚至被外界视为已与Kimi官方达成某种和解。

然而，许多网友对此并不认可。

Cursor的技术路径：基于Kimi K2.5的两步训练

报告开篇，Cursor首先评估并肯定了Kimi K2.5的基础能力，称其在多项潜在开源基础模型中综合表现最佳，且在执行效率等方面具备优势。

随后，报告详细阐述了基于Kimi K2.5的两步独立训练流程：持续预训练与异步强化学习。

1. 持续预训练
此阶段旨在提升模型在编码领域的基础能力，为后续强化学习训练做准备。主要分为三个子阶段：
– 将主要计算资源投入32K令牌序列长度的训练。
– 进行短期的上下文扩展训练，将序列长度提升至256K。
– 通过小样本指令微调，使模型适配特定代码任务。

此外，为提升推理速度，模型引入了多令牌预测层，并结合投机解码与自蒸馏策略以保障收敛速度。训练数据显示，模型在自研代码库上的损失值呈对数线性下降，且代码库困惑度与下游强化学习性能正相关，证明了预训练的有效性。

Cursor套壳Kimi风波再起：Composer 2技术报告自证“有技术地套”，网友却不买账

2. 异步强化学习
训练环境高度模拟真实的Cursor对话场景，覆盖各类软件工程核心任务。训练框架基于大规模策略梯度实现，采用单指令多样本的策略梯度算法，并设置固定样本组大小以保持稳定。
– 每条指令仅参与一次训练，使用Adam优化器更新全部参数。
– 优化了GRPO算法，移除了长度标准化项以避免偏差，并引入KL散度进行正则化。

研究指出，最终模型的平均性能与最佳采样性能同步提升，表明强化学习不仅重新加权了推理路径，还扩展了正确解决方案的覆盖范围。

Cursor套壳Kimi风波再起：Composer 2技术报告自证“有技术地套”，网友却不买账

Composer 2还引入了一系列辅助奖励机制，包括对代码风格、交互表达的奖励，以及对不当工具调用的惩罚，并根据训练中涌现的行为动态调整规则。

自研评估基准：CursorBench

为进行评估，Cursor推出了自研的内部评估集——CursorBench。该基准的任务均源自真实的智能体使用场景，评估维度不仅包括功能正确性，还涵盖代码质量、执行效率、智能体交互等多个方面。

数据显示，CursorBench的任务代码修改量更大（中位数181行），而指令提示则更简洁（中位数390字符），更贴近实际使用。

Cursor套壳Kimi风波再起：Composer 2技术报告自证“有技术地套”，网友却不买账

在测试结果上，Composer 2在CursorBench-3中的准确率达到61.3%，较其1.5版本和1.0版本分别有显著提升，相比基础模型Kimi K2.5也有大幅进步。

Cursor套壳Kimi风波再起：Composer 2技术报告自证“有技术地套”，网友却不买账

报告总结称，Composer 2在成本与精度上实现了帕累托最优，推理成本与更小模型相当，精度则可媲美更大尺寸的前沿模型，令牌使用效率也与其它先进模型持平。

杨植麟论大模型发展的未来方向

在Cursor发布报告的同时，Kimi创始人杨植麟在中关村论坛的演讲中，分享了对大模型及训练范式的最新思考。

他认为，大模型的本质是将能源转化为智能，关键在于实现规模化。有效的规模化并非盲目堆砌算力，而需讲求方法与效率。

Cursor套壳Kimi风波再起：Composer 2技术报告自证“有技术地套”，网友却不买账

Kimi的规模化策略聚焦于三点：
1. 提升令牌效率：追求以有限数据学习更多智能。
2. 扩展上下文长度：通过创新的网络架构（如Kimi Linear）和训练数据，从根本上提升长上下文处理能力。
3. 引入智能体集群：在Kimi K2.5中提出，通过多个智能体协作解决复杂问题，实现输入、输出、执行与编排的规模化。

Cursor套壳Kimi风波再起：Composer 2技术报告自证“有技术地套”，网友却不买账

同时，杨植麟强调了底层网络架构的重要性。例如，其开源的注意力残差架构，可视为注意力机制在网络深度上的LSTM变种，能更高效地利用各层信息。他指出，在当今算力更强、研究更工程化的背景下，过去的技术标准答案可以被重新挑战和改进。

Cursor套壳Kimi风波再起：Composer 2技术报告自证“有技术地套”，网友却不买账

关于开源，杨植麟表示将持续推进：

开源模型正在成为新的标准。以Kimi K2.5为代表的开源模型，已成为全球芯片厂商测试硬件性能的基准，也被众多研究机构采用。我们希望通过开源降低获取智能的门槛，最终形成开源生态系统，共同推动AI发展。

最后，他断言大模型训练已进入第三阶段：

Cursor套壳Kimi风波再起：Composer 2技术报告自证“有技术地套”，网友却不买账

第一阶段（2023-2024年）：以天然数据为主，人工标注为辅。
第二阶段（2025年）：更重视人工筛选高质量任务，并构建大规模强化学习系统。
第三阶段（2026年起）：AI研发流程发生根本变化，研发主体将从人转向AI。AI将自主合成任务、构建训练环境乃至探索新架构，研究员更多提供算力与令牌资源。AI将从被训练者，逐渐转变为研发的参与者与主导者，推动领域发展速度急剧提升。

参考资料
[1] https://x.com/cursor_ai/status/2036566134468542651
[2] https://cursor.com/resources/Composer2.pdf
[3] https://mp.weixin.qq.com/s/GjN_dx380VnUmRWHGRajiA

关注“鲸栖”小程序，掌握最新AI资讯

本文来自网络搜集，不代表鲸林向海立场，如有侵权，联系删除。转载请注明出处：https://www.itsolotime.com/archives/27650

Cursor Kimi 代码生成开源模型强化学习

赞 (0)

0 0

林俊旸离职阿里千问后首次发声：从“推理模型时代”到“智能体时代”的思考转变

上一篇 2026年3月27日上午10:34

MoE模型：稀疏化革命如何突破大语言模型扩展瓶颈？

下一篇 2026年3月27日上午10:36

AI产业动态

《赛博徒步·生死鳌太线》生存模拟器深度评测：AI驱动的极限生存挑战与策略博弈

梦瑶发自凹非寺量子位 | 公众号 QbitAI “不卖烤肠的山，不要爬”。原本我以为，听完《神秘园》的劝，这辈子大概就和勇闯鳌太这事儿彻底绝缘了。直到事情开始朝着一个有点离谱的方向发展—— 昨天半夜，我只是顺手点开了网友发来的一个链接，下一秒，人就已经魂穿赛博鳌太线，开始玩命进山了：在这儿，你压根不用操心预算经费的问题，开局一笔巨款，顶级装备…

2026年2月1日
911000
AI产业动态

嵌套学习与记忆熊：AI记忆革命如何重塑大模型进化路径

近期，Google Research发表的《Nested Learning: The Illusion of Deep Learning Architectures》论文在业界引发广泛关注，被普遍视为2017年《Attention is All You Need》的“精神续作”。这篇论文之所以获得如此高的评价，关键在于它提出了一种全新的机器学习范式——嵌套学…

2025年12月3日
402000
AI产业动态

Game-TARS：从游戏玩家到通用计算机用户的革命性跨越——基于统一键盘鼠标动作空间的智能体范式

在人工智能与游戏交互的交叉领域，一项突破性进展正在重新定义智能体的能力边界。字节跳动Seed团队最新发布的Game-TARS通用型游戏智能体，不仅实现了在《我的世界》、《神庙逃亡》、《星露谷》等多样化游戏环境中的卓越表现，更通过零样本迁移能力在未见过的3D网页游戏中展现惊人适应性。这一成就的背后，是团队对智能体交互范式的根本性重构——从传统的函数调用模式转…

2025年10月30日
351000
AI产业动态

GitLab创始人用AI与系统思维对抗癌症：当工程师开启“创始人模式”自救

当我们讲述「抗癌故事」时，「励志」是最常用的词。但在 GitLab 联合创始人 Sid Sijbrandij 身上，这个词已远远不够。他以创始人思维、AI 与前沿诊疗方法，为自己开辟了一条独特的求生之路。 GitLab 的两位联合创始人：Dmytro Zaporozhets（左）和 Sid Sijbrandij（右）。他以 GitLab 的管理方法论重构癌…

2026年3月29日
471000
AI产业动态

强化学习赋能文本到3D生成：从算法突破到能力边界探索

在人工智能生成内容领域，文本到3D生成技术正成为继大语言模型和文生图之后的下一个前沿阵地。这一技术旨在将自然语言描述转化为具有复杂几何结构、纹理细节和物理合理性的三维模型，其应用潜力覆盖数字孪生、游戏开发、工业设计、虚拟现实等多个关键领域。然而，与相对成熟的文本到2D图像生成相比，文本到3D生成面临着更为严峻的技术挑战：三维数据本身具有更高的维度复杂性、更强…

2025年12月19日
432000