策略游戏

  • 《赛博徒步·生死鳌太线》生存模拟器深度评测:AI驱动的极限生存挑战与策略博弈

    梦瑶 发自 凹非寺 量子位 | 公众号 QbitAI “不卖烤肠的山,不要爬”。 原本我以为,听完《神秘园》的劝,这辈子大概就和勇闯鳌太 这事儿彻底绝缘了。 直到事情开始朝着一个有点离谱的方向发展—— 昨天半夜,我只是顺手点开了网友发来的一个链接,下一秒,人就已经魂穿赛博鳌太线 ,开始玩命进山了: 在这儿,你压根不用操心预算经费的问题,开局一笔巨款,顶级装备…

    2026年2月1日
    51700
  • 清华MARSHAL框架:通过策略游戏自博弈激发大模型的多智能体推理泛化能力

    近日,清华大学等机构的研究团队提出了 MARSHAL 框架。该框架利用强化学习,让大语言模型在策略游戏中进行自博弈(Self-Play)。实验表明,这种多轮、多智能体训练不仅提升了模型在游戏中的博弈决策水平,更将其推理能力有效泛化到了通用的多智能体系统中:在数学竞赛和专家级问答等一般推理任务中,显著提升了多智能体系统的整体表现。 论文标题:MARSHAL: …

    2026年1月9日
    20600