人工智能研究
-
GEMS:让6B小模型超越Nano Banana 2!多模态生成新范式,Agent+记忆+技能三合一
GEMS:Agent-Native Multimodal Generation with Memory and Skills 当前的多模态生成模型虽然在主流任务上表现出色,但在处理复杂指令和下游任务时仍有不足。 近期,先进的智能体(Agent)框架(如OpenClaw、Claude Code)在复杂真实任务中展现出强大能力。受此启发,上海人工智能实验室联合南…