SOTA - 鲸林向海

斯坦福伯克利英伟达联合发布Agent验证框架：扩展验证计算量超越GPT-5.5

本项目由斯坦福大学计算机科学博士生 Jacky Kwok 主导，核心贡献者包括伯克利 EECS 博士生 Shulu Li。通讯作者阵容包括：Ion Stoica（加州大学伯克利分校教授、Databricks 创始人）、Azalia Mirhoseini（斯坦福大学教授，曾任职于 DeepMind 与 Anthropic）以及 Marco Pavone（英伟达…

2026年4月26日

283000

开源项目

OpenSeeker：首个开源全量训练数据的深度搜索Agent，纯学术团队打破大厂数据垄断

一直以来，高性能的深度搜索智能体（Search Agent）领域仿佛被一道“数据护城河”所隔绝。尽管开源模型层出不穷，但决定智能体能力上限的高质量训练数据——尤其是包含复杂决策与工具调用轨迹的数据——却始终被大型科技企业严密掌控。这种数据稀缺的局面，严重制约了更广泛研究社区在该领域的创新与探索。今天，这一现状被上海交通大学的研究团队彻底打破。他们推出了 O…

2026年4月1日

421000

AI产业动态

谷歌Gemini 3.1 Pro震撼发布：百万Token上下文、全领域SOTA刷新、SVG生成王者，价格不变性能翻倍

今天凌晨，谷歌正式发布了Gemini 3.1 Pro模型。该模型在多项基准测试中刷新了全领域SOTA（State-of-the-Art）记录，实现了推理能力的大幅跃升。在ARC-AGI-2测试中，Gemini 3.1 Pro得分77.1%，性能是上一代3.0 Pro的两倍多。在ARC-AGI-1测试中，新模型得分达到98%，超越了GPT-5.2 Pro和C…

2026年2月20日

598000