结构化稀疏性

AI产业动态

UNCOMP：从矩阵熵悖论到KV Cache优化——揭秘大模型深层稀疏性的理论突破与实践创新

大语言模型（LLM）中的结构化稀疏性现象，尤其是模型深度与稀疏性增强的正相关性，以及“检索头”和“检索层”的涌现机制，长期以来缺乏统一的理论解释。这些现象不仅关乎模型效率，更触及LLM内部信息处理的核心逻辑。我们荣幸地宣布，论文《UNComp: Can Matrix Entropy Uncover Sparsity? — A Compressor…

2025年11月13日
170000