SOTA
-
斯坦福伯克利英伟达联合发布Agent验证框架:扩展验证计算量超越GPT-5.5
本项目由斯坦福大学计算机科学博士生 Jacky Kwok 主导,核心贡献者包括伯克利 EECS 博士生 Shulu Li。通讯作者阵容包括:Ion Stoica(加州大学伯克利分校教授、Databricks 创始人)、Azalia Mirhoseini(斯坦福大学教授,曾任职于 DeepMind 与 Anthropic)以及 Marco Pavone(英伟达…
-
OpenSeeker:首个开源全量训练数据的深度搜索Agent,纯学术团队打破大厂数据垄断
一直以来,高性能的深度搜索智能体(Search Agent)领域仿佛被一道“数据护城河”所隔绝。尽管开源模型层出不穷,但决定智能体能力上限的高质量训练数据——尤其是包含复杂决策与工具调用轨迹的数据——却始终被大型科技企业严密掌控。这种数据稀缺的局面,严重制约了更广泛研究社区在该领域的创新与探索。 今天,这一现状被上海交通大学的研究团队彻底打破。他们推出了 O…
-
谷歌Gemini 3.1 Pro震撼发布:百万Token上下文、全领域SOTA刷新、SVG生成王者,价格不变性能翻倍
今天凌晨,谷歌正式发布了Gemini 3.1 Pro模型。该模型在多项基准测试中刷新了全领域SOTA(State-of-the-Art)记录,实现了推理能力的大幅跃升。 在ARC-AGI-2测试中,Gemini 3.1 Pro得分77.1%,性能是上一代3.0 Pro的两倍多。在ARC-AGI-1测试中,新模型得分达到98%,超越了GPT-5.2 Pro和C…
