隐状态复用

AI产业动态

TrajSelector：轻量级隐状态复用，突破大模型推理的Best-of-N性能瓶颈

在大型语言模型（LLM）日益成为解决复杂任务核心工具的当下，测试时扩展（Test-Time Scaling，TTS）已成为提升模型推理能力的关键技术路径。该技术通过在模型“答题”阶段动态分配更多计算资源，显著优化其表现。当前，Test-Time Scaling主要分为两大范式：内部测试时扩展，以DeepSeek-R1等推理模型为代表，通过延长思维链实现；外部…

2025年11月6日
167000