链式思维
-
DeepSeek颠覆多模态推理:7056倍压缩视觉Token,性能媲美GPT-5.4
“Seeing is not Reasoning.” 当 DeepSeek 团队在其最新论文《Thinking with Visual Primitives》中写下这句简短有力的论断时,他们实际上戳破了当前多模态大模型领域一个被普遍忽视却致命的泡沫——我们一直以为让模型看得更清楚就能推理得更好,但真相却是:即便为模型配备显微镜级别的视觉感知能力,其在复杂空间…
-
DAC-RL:首个分治推理强化学习训练框架,突破链式思维局限,实现6.3%推理性能跃升
关键词:分治推理、强化学习、测试时可扩展性、链式思维、大语言模型训练 近年来,大型语言模型(LLMs)在复杂推理任务上展现出惊人能力,尤其是基于链式思维(Chain-of-Thought, CoT) 的逐步推理方法,已成为解决数学、逻辑与编程问题的标准范式。 然而,随着问题难度提升至竞赛级别(如国际数学奥林匹克、高阶定理证明等),传统 CoT 往往显得力不从…
