KV缓存分析
-
ELANA:无需代码修改的LLM能效与延迟分析利器,精准评测每token能耗与三维延迟
ELANA: A Simple Energy and Latency Analyzer for LLMs https://arxiv.org/pdf/2512.09946 https://github.com/enyac-group/Elana 大型语言模型(LLM)在各类硬件平台部署时,延迟与能耗是核心约束 ,而 现有评测工具缺乏统一、轻量化的 LLM 专…