DeepGEMM
-
DeepGEMM质变:从GEMM库到统一LLM计算原语平台,Mega MoE与FP4 Indexer重磅发布
DeepGEMM质变:从GEMM库到统一LLM计算原语平台 自2025年初首次亮相以来,DeepGEMM一直是DeepSeek团队面向NVIDIA GPU(SM90/SM100)打造的高性能Tensor Core内核库。 然而,本次PR #304标志着DeepGEMM完成了一次根本性的蜕变——从一个”干净高效的GEMM库”升级为…
DeepGEMM质变:从GEMM库到统一LLM计算原语平台 自2025年初首次亮相以来,DeepGEMM一直是DeepSeek团队面向NVIDIA GPU(SM90/SM100)打造的高性能Tensor Core内核库。 然而,本次PR #304标志着DeepGEMM完成了一次根本性的蜕变——从一个”干净高效的GEMM库”升级为…