推理优化_鲸林向海

SIM-CoT：隐式推理新突破，零开销实现可解释的AI内部思考

魏熙林是本文的第一作者，复旦大学博士生，师从林达华教授，研究方向主要为多模态大语言模型与高效人工智能。他目前在上海人工智能实验室实习，指导老师为臧宇航与王佳琦。本文介绍隐式思维链（Implicit Chain-of-Thought）的最新进展——SIM-CoT（Supervised Implicit Chain-of-Thought）。该方法直击了隐式Co…

1天前

35000

大模型推理

FastDriveVLA：专为自动驾驶VLA模型定制的视觉token剪枝方法，实现高效端到端驾驶

VLA 模型正被越来越多地应用于端到端自动驾驶系统中。然而，VLA 模型中冗长的视觉 token 极大地增加了计算成本。现有的通用视觉 token 剪枝方法并非为自动驾驶场景设计，在实际应用中存在诸多局限性。小鹏汽车联合北京大学计算机科学学院多媒体信息处理国家重点实验室发表论文《FastDriveVLA》，为自动驾驶 VLA 模型中的高效视觉 token …

2026年1月4日

68000

AI产业动态

信息论视角下的思考革命：Adaptive Think如何终结大模型的过度推理困境

在人工智能领域，大模型的推理能力已成为衡量技术进步的关键指标。从OpenAI的o1系列到DeepSeek的R1，再到QwQ等强化学习推理模型，这些系统通过生成冗长的推理链条（Chain-of-Thought，CoT），在数学、逻辑和常识推理任务中展现出令人瞩目的多步推理能力。然而，中国人民大学、腾讯Jarvis Lab和西湖大学的研究团队通过深入分析发现，当…

2025年12月19日

85000

AI产业动态

2025年AI大分流：100万亿Token数据揭示开源崛起、推理为王与亚洲时刻

100万亿Token实证：2025年AI大分流全景图 2025年，人工智能领域迎来一个结构性转折点。OpenRouter与a16z联合发布了一份基于真实算力消耗的深度研究报告，通过分析过去一年处理的超过100万亿个Token的元数据，揭示了当前AI发展的核心趋势与反直觉洞察。这份报告摒弃了传统的学术基准或宣称的用户数，从全球300多个模型、60多个提供方的实…

2025年12月6日

94000

AI产业动态

华为诺亚方舟实验室突破Transformer推理瓶颈：高阶注意力机制Nexus的架构革命

在人工智能领域，Transformer架构凭借其强大的序列建模能力，已成为大语言模型（LLM）和各类生成式AI应用的基石。然而，随着模型规模和应用场景的不断扩展，其核心组件——自注意力机制（Self-Attention）在处理复杂逻辑推理任务时的局限性日益凸显。传统注意力机制本质上是一种基于配对比较的线性投影操作，擅长捕捉长距离依赖和表面关联，但在面对需要多…

2025年12月5日

104000

大模型评测

DeepSeek-V3.2实测：稀疏注意力机制DSA如何实现推理效率与性能的协同突破

深度求索近期发布了DeepSeek-V3.2版本，这是一款在计算效率、推理能力和智能体性能方面实现协调统一的模型。其高算力变体DeepSeek-V3.2-Speciale在2025年IMO和IOI中均达到了金牌水平。此次评测重点是评测思考模式（Think），其思考模式下的DeepSeek-V3.2（下面简称DeepSeek-V3.2-Think）在多个维度实…

2025年12月4日

83000

大模型评测

Grok-4-1-fast-reasoning评测：速度与成本的革命性优化，准确率与专业能力的权衡

XAI近期发布了Grok-4-1-fast模型，官方将其定义为“针对高性能智能体工具调用进行优化的前沿多模态模型”。该模型支持思考模式与非思考模式两种版本。本次评测聚焦于思考模式版本 grok-4-1-fast-reasoning。相比此前的 grok-4-0709 版本，新版本在响应速度上实现了显著优化，但在准确率方面有所下降。我们对这两个版本在准确率、响…

2025年11月26日

115000

AI产业动态

SimKO算法突破RLVR探索困境：实现大模型推理中探索与利用的平衡

在DeepSeek-R1、Kimi1.5等模型相继展示强化学习对大型语言模型复杂推理能力的显著提升后，可验证强化学习（RLVR）在数学、逻辑与编程等领域的应用已成为研究热点。然而，现有RLVR方法在提升模型pass@1性能的同时，却导致pass@K（K>1）性能下降，这一矛盾现象揭示了当前强化学习范式的根本缺陷。 **RLVR的探索困境：概率分布的过度…

2025年11月8日

84000

AI产业动态

推理模型效率革命：英伟达DLER如何用强化学习实现“短而精”的思考

在通往通用人工智能（AGI）的道路上，推理能力被视为核心瓶颈之一。过去一年，以OpenAI o系列、DeepSeek-R1、Qwen为代表的推理模型通过“长链思维”策略显著提升了复杂问题解决能力，但这种进步伴随着沉重的代价：推理链条不断延长导致Token消耗呈指数级增长，响应速度大幅下降，部署成本急剧攀升。当DeepSeek-R1在AIME-24数学基准上需…

2025年11月4日

94000

AI产业动态

高通进军AI推理芯片市场：挑战英伟达霸权的移动技术新路径

在人工智能芯片领域，英伟达长期占据主导地位，其GPU在训练和推理市场均形成近乎垄断的格局。然而，这种局面正面临来自多方的挑战。高通作为移动通信和计算领域的巨头，近日宣布将于明年推出AI200芯片，并计划在2027年跟进AI250芯片，正式进军AI推理芯片市场。这一战略举措不仅反映了高通自身业务拓展的雄心，更揭示了AI芯片市场格局可能发生的深刻变化。高通此次…

2025年10月28日

75000