训练-推理一致性

AI产业动态

DualSpeed：革命性双模视觉Token修剪框架，实现MLLM训练4倍加速与99%性能保留

关键词：视觉令牌修剪、多模态大语言模型、高效训练、训练-推理不匹配、双模训练近年来，多模态大语言模型在图像描述、视觉问答、视觉定位、多模态推理等任务中取得了显著突破，成为人工智能领域的重要研究方向。然而，随着模型规模不断扩大、视觉输入分辨率持续提升，MLLMs 的训练成本急剧上升，成为制约其发展和应用的关键瓶颈。传统的效率优化方法主要聚焦于模型压缩、参数…

2026年2月5日
345000