模型部署
-
ELANA:无需代码修改的LLM能效与延迟分析利器,精准评测每token能耗与三维延迟
ELANA: A Simple Energy and Latency Analyzer for LLMs https://arxiv.org/pdf/2512.09946 https://github.com/enyac-group/Elana 大型语言模型(LLM)在各类硬件平台部署时,延迟与能耗是核心约束 ,而 现有评测工具缺乏统一、轻量化的 LLM 专…
-
DeepSeek爆火背后的安全隐忧:从模型下载到部署运营的全链路风险剖析
近几个月,国产开源大模型DeepSeek凭借“小参数、高性能”的显著优势迅速席卷市场,引发了企业私有化部署需求的激增。然而,在这股AI应用热潮的背后,却暗藏着不容忽视的安全风险。最新数据显示,高达88.9%的企业在部署AI服务器时未采取任何基础安全措施,而像Ollama这类默认未启用安全认证的流行框架,更使得企业服务器如同“大门敞开”,暴露于多重威胁之下。本…