大模型训练
-
卡帕西2025大模型预言:RLVR革命、锯齿智能与端侧智能体崛起
鹭羽 发自 凹非寺 2025年有哪些AI趋势?大神卡帕西的年终总结正在硅谷引发热议。 他提出了六大硬核且富有启发性的论断: RLVR (可验证奖励强化学习) 成为训练新阶段 大模型不应被类比为动物智能 Cursor展现了大模型应用的Next Level Claude Code加速端侧智能体普及 Vibe Coding将重塑软件行业 Nano Banana重塑…
-
“微调已死”新佐证:谷歌革新AI学习范式,开创双向经验学习之路
谷歌提出ReasoningBank技术,使AI能通过从自身成功与失败的经验中学习,形成一个持续自我优化的闭环,从而减少对传统微调的依赖。