GPU架构
-
NVIDIA Blackwell架构微基准深度解析:FP4/FP6赋能LLM推理2.5倍加速,36.3TFLOPS FP64重塑科学计算
关键词:Blackwell、GPU、 Microbenchmark 、5th-generation Tensor Core 、 TMEM 本文工作量化了张量内存(TMEM)对矩阵密集型负载的影响,评估了硬件解压缩引擎(DE)的吞吐量及最优使用方式,通过新的tcgen05 PTX 指令分析了第五代张量核心的执行特性。 此外,还评估了 FP4 与 FP6 精度的…
-
英伟达CES 2026重磅发布:Rubin架构GPU性能飙升5倍,物理AI平台Cosmos引领全栈生态革命
英伟达CES 2026重磅发布:Rubin架构GPU性能飙升5倍,物理AI平台Cosmos引领全栈生态革命 刚刚,英伟达CEO黄仁勋在全球最大消费电子展CES 2026上发布了全新AI产品。这是五年来英伟达首次在CES上未发布游戏显卡,其战略重心已明确转向全力投入AI。 这一战略的成果引人瞩目。下一代Rubin架构GPU在NVFP4数据格式下,推理与训练性能…
-
摩尔线程MUSA 5.0发布:国产全功能GPU架构花港亮相,算力密度提升50%,能效提升10倍
上市仅15天后,摩尔线程便将首个大动作直接指向了生态的核心——开发者。 在首届、也是国内首个聚焦全功能GPU的开发者大会上,围绕MUSA这一关键词,新品密集发布: 一个全新GPU架构:花港,算力密度提升50%,能效提升10倍。 三款新芯片:华山、庐山、长江,分别聚焦AI训推一体、图形渲染和智能SoC。 一个智算集群:夸娥万卡集群(KUAE2.0),定位国产自…