通用视觉大模型

  • 谷歌DeepMind发布Vision Banana:图像生成预训练统一视觉感知任务

    谷歌DeepMind以Nano Banana Pro为底座,最新发布通用多模态视觉大模型Vision Banana —— 何恺明、谢赛宁 参与,证明图像生成预训练,可以成为通用视觉学习的统一范式 。 一个通用模型,零样本迁移下,击败SAM 3、Depth Anything 3等专用模型,分割、深度、法线核心任务刷新多项SOTA。 就像LLM用文本生成统一所有…

    大模型工程 2天前
    17500