谷歌研究
-
谷歌ICLR顶会论文陷抄袭风波:TurboQuant核心技术被指两年前已由ETH团队提出,引发AI圈学术地震
一场席卷市场的震荡,意外牵出了一桩学术争议。 本周五晚,谷歌研究团队的一篇论文陷入学术不端指控,成为AI社区关注的焦点。苏黎世联邦理工学院(ETH Zurich)的博士后研究员高健扬发文指出,谷歌研究团队的论文《TurboQuant: Online Vector Quantization with Near-optimal Distortion Rate》在…
-
谷歌TurboQuant算法震撼发布:KV Cache压缩6倍精度零损失,AI推理迎来内存革命
谷歌研究院在即将到来的ICLR 2026学术会议上展示了一项突破性研究,推出了名为 TurboQuant 的新型压缩算法。该算法能够将AI推理过程中内存消耗最大的KV Cache压缩至少6倍,同时实现精度零损失。这一进展被市场解读为可能显著降低长上下文AI推理对内存的需求。 KV Cache量化至3比特 要理解TurboQuant的重要性,首先需要明确其解决…
