数据效率

  • Flapping Airplanes:用“小数据”挑战AI范式,1.8亿美元融资背后的强智能革命

    你想象中真正的 AI 是什么样子的? 至少有一点,大多数人会同意:未来的 AI,应该具备像人一样思考的能力。 问题在于,我们现在研究大模型走的这条路,能通向真正的「思考」吗? 当前最先进的大模型系统,几乎是在整个人类可获取的历史数据之上训练出来的:网页、书籍、代码、论文、对话,数万亿 token。训练大模型所需的数据,远超任何一个人类个体一生所能接触的总和。…

    4天前
    2000
  • Video4Edit:将图像编辑视为退化时序过程,以1%数据实现SOTA性能

    在AI图像编辑领域,高质量训练数据的稀缺一直是制约模型性能与泛化能力的关键瓶颈。传统基于扩散模型的编辑方法通常依赖大规模三元组数据(指令-源图像-编辑后图像)进行监督训练,这不仅带来高昂的数据采集与标注成本,也难以覆盖用户多样化的编辑意图。更根本的是,现有方法往往陷入“结构保持”与“纹理修改”的权衡困境:过度强调结构一致性会限制编辑的灵活性,而追求大幅语义修…

    2025年12月6日
    8700