vectorization
-
打破库依赖与93%峰值效率!Intel提出MLIR驱动的编译器自动生成NanoKernel实现高性能矩阵乘法内核
关键词: MLIR 、Nanokernels 、 Microkernels 、Matmul、Vectorization、Compiler 超微内核(Nanokernel) 指寄存器级别的最小计算单元,专为特定硬件指令集优化,可作为可组合的、目标无关的编译器 IR 到目标特定指令的 kernel。 论文标题:Library Liberation: Compet…