混合专家模型

150美元FPGA平台实现30B MoE大模型边缘推理，18 token/s解码速度突破成本性能极限

关键词： FPGA 加速器、混合专家模型（MoE）、边缘部署、低成本推理、GEMV 优化以150美元物料成本和18 token/s的解码速度，FPGA在大语言模型边缘部署领域取得了关键性突破。在深度学习硬件加速领域，FPGA的定位一直较为特殊。它既不具备GPU那样统治训练市场的极致算力密度，也难以像ASIC那样在特定场景下实现终极能效。长期以来，FPGA…

2天前

156000

大模型训练

Meta与ThinkMachine联手突破MoE训练内存墙：MoEBlaze框架实现内存降低4倍、训练加速6倍

关键词： MoEBlaze 、内存墙、MoE 训练、索引化路由在当今大模型浪潮中，参数规模已突破万亿，训练成本与内存压力成为制约模型规模继续扩大的关键瓶颈。混合专家模型（Mixture-of-Experts, MoE）因其能够以稀疏激活的方式实现万亿参数级别的模型训练，已成为大规模语言模型的主流架构之一。然而，MoE 的稀疏性在降低计算密度的同时，也…

2026年1月13日

245000

大模型工程

Gemini 3 揭示AI研发新范式：从算法灵感转向系统工程，精细化时代如何重塑智能进化？

内容来源 —— “We’re Ahead of Where I Thought We’d Be — Gemini 3 & the Future of AI”观看网址：https://www.youtube.com/watch?v=cNGDAqFXvew 在AI模型性能持续突破的今天，我们或许需要重新审视一个问题：驱动智能进化的，究竟是偶然的算法灵感，…

2025年12月26日

217002