RAM框架

AI产业动态

清华RAM框架：大模型学会人类式精读略读，实现12倍推理加速与性能翻倍

RAM团队投稿量子位 | 公众号 QbitAI 让大模型像人类一样阅读！通过精读略读实现性能与效率的双重飞跃。在长上下文场景中，Transformer架构的二次计算复杂度让推理速度急剧下降，而人类面对长文档时却能游刃有余——我们不会逐字阅读整本小说，而是对关键情节精读，对背景描述略读。来自清华大学、鹏城实验室与阿里巴巴未来生活实验室的联合研究团队发现…

2026年2月14日
349000