谷歌Gemini生态全面升级:Deep Research智能体与Interactions API重塑AI研究范式

近日,谷歌在AI领域展开了一系列重要更新,不仅正式发布了增强版的Gemini Deep Research智能体,还配套推出了DeepSearchQA基准测试集以及全新的Interactions API。这一系列动作标志着谷歌正在加速构建更强大、更完整的Gemini生态系统,旨在提升AI在复杂信息检索与分析任务中的表现,特别是在减少幻觉、增强多步骤推理能力方面取得了显著进展。

谷歌Gemini生态全面升级:Deep Research智能体与Interactions API重塑AI研究范式

增强版的Gemini Deep Research基于Gemini 3 Pro构建,专门针对幻觉问题进行了优化。在复杂信息检索与分析任务中,该智能体展现出了领先的性能。谷歌计划将其集成到多个核心产品中,包括谷歌搜索、NotebookLM、Google Finance以及升级版的Gemini App,这将极大地提升这些工具的研究能力和用户体验。

谷歌Gemini生态全面升级:Deep Research智能体与Interactions API重塑AI研究范式

为了更全面地评估深度搜索与研究任务的性能,谷歌推出了DeepSearchQA基准测试集。这一测试集的发布填补了现有基准在衡量真实场景下多步骤网络研究复杂特性方面的不足。DeepSearchQA包含了来自17个领域的900个手工设计的因果链任务,要求模型必须生成详尽的答案集合,从而能够更准确地评估智能体在多步推理与信息融合中的综合能力。

谷歌Gemini生态全面升级:Deep Research智能体与Interactions API重塑AI研究范式

与此同时,谷歌发布了Interactions API,为开发者提供了与Gemini 3 Pro和Deep Research智能体交互的统一接口。随着模型功能的不断拓展,AI能力逐渐从单纯的无状态文本生成转向更复杂的思考和高级工具使用。原有的generate Content接口在面对新的交互模式时逐渐显得力不从心,如果强行将新功能融入其中,会使API变得过于脆弱。

谷歌Gemini生态全面升级:Deep Research智能体与Interactions API重塑AI研究范式

Interactions API通过设计原生接口,提供了一个统一的RESTful端点。开发者只需指定模型或智能体参数,就能与模型和智能体进行复杂上下文的交互。这一接口特别适合需要多步骤推理、工具调用以及长程任务执行的场景,为构建更智能的应用提供了强大支持。

谷歌Gemini生态全面升级:Deep Research智能体与Interactions API重塑AI研究范式

增强版的Gemini Deep Research最引人注目的能力之一是迭代式推理。该智能体不仅能提出查询需求,还能读取和整合搜索结果,发现知识空白,然后针对性地开展新一轮搜索。通过这种循环式操作,它大幅提升了网络搜索能力,能够深入网站抓取精确信息。有网友已经尝试使用新的智能体构建论文生成器,初步效果令人鼓舞。

谷歌Gemini生态全面升级:Deep Research智能体与Interactions API重塑AI研究范式

这种迭代推理能力使Gemini Deep Research在复杂研究任务中表现出色。在人类最后的考试HLE、BrowseComp以及DeepSearchQA等测试中,该智能体刷新了SOTA成绩,证明了其在多步骤推理和信息整合方面的优势。

谷歌Gemini生态全面升级:Deep Research智能体与Interactions API重塑AI研究范式

DeepSearchQA基准测试集的设计理念值得深入探讨。传统的事实检索测试往往难以体现真实研究场景的复杂性,而DeepSearchQA通过因果链任务的设计,要求模型不仅要找到相关信息,还要理解信息之间的逻辑关系,并生成连贯、详尽的答案。这种评估方式更接近人类研究者的实际工作流程,能够更真实地反映AI在研究任务中的实际能力。

谷歌Gemini生态全面升级:Deep Research智能体与Interactions API重塑AI研究范式

Interactions API的推出代表了AI开发接口的重要演进。它不仅扩展了generate Content的核心能力,还具备服务器端状态可选、可解释且可组合的数据模型、后台执行以及远程MCP工具支持等特性。这些功能使得Interactions API能够更好地支持复杂的工作流,简化开发过程,更加适配现代开发环境的需求。

谷歌Gemini生态全面升级:Deep Research智能体与Interactions API重塑AI研究范式

总体来看,谷歌的这一系列更新不仅仅是单个产品的升级,更是整个Gemini生态系统的重要演进。从智能体能力的提升到基准测试的完善,再到开发接口的优化,谷歌正在构建一个更加完整、强大的AI研究与应用平台。随着这些新功能逐步集成到谷歌的核心产品中,我们有理由期待AI在研究、分析和信息处理方面将发挥更加重要的作用,推动整个行业向更智能、更高效的方向发展。


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/archives/7107

(0)
上一篇 2025年12月12日 下午12:30
下一篇 2025年12月12日 下午2:18

相关推荐

  • UNeMo:多模态世界模型与分层预测反馈机制重塑视觉-语言导航新范式

    在具身智能(Embodied AI)领域,视觉-语言导航(VLN)作为核心任务之一,要求智能体仅凭视觉图像和自然语言指令,在未知环境中自主完成目标导航。随着大语言模型(LLM)的兴起,基于LLM的导航方法虽取得一定进展,但仍面临推理模态单一、优化目标冲突等关键瓶颈。深圳大学李坚强教授团队联合北京理工莫斯科大学等机构提出的UNeMo框架,通过多模态世界模型(M…

    2025年12月10日
    58000
  • 破折号成瘾:AI写作风格如何暴露大模型训练数据的历史断层

    在人工智能写作领域,一个看似微不足道的标点符号——破折号——正成为揭示大模型训练数据来源与时代局限性的关键线索。用户普遍观察到,以ChatGPT为代表的AI产品在生成文本时频繁使用破折号,这种现象已从偶然特征演变为AI写作的标志性风格。OpenAI甚至将“减少破折号使用”作为产品改进功能单独发布,反映出用户对此现象的普遍关注。这一现象背后,隐藏着大模型训练数…

    2025年11月29日
    38400
  • 中国团队首创医疗AI临床安全-有效性双轨评估标准CSEDB,MedGPT全球评测夺冠

    中国团队首创医疗AI临床安全-有效性双轨评估标准CSEDB,获《npj Digital Medicine》收录 中国团队首次在全球顶尖期刊发表“大模型+医疗”领域的相关标准研究。 作为Nature体系中专注于数字医疗的旗舰期刊,《npj Digital Medicine》(JCR影响因子15.1,中科院医学大类1区Top期刊)此次收录的CSEDB研究,首次提…

    2026年1月21日
    55100
  • AI Ping:大模型API的智能导航与评测平台,终结选型混沌时代

    衡宇 发自 凹非寺 比面对大模型黑盒更让人抓瞎的事情,就是要去选既靠谱、性价比又高的API服务。 这几乎是每一个涉足AI应用开发的团队都会经历的至暗时刻。 同一个模型架构在不同的供应商手里,不仅价格上有出入,延迟、稳定性、吞吐量等用户关心的指标,波动幅度巨大。 在API调用动辄几十万、上百万token的时代,API选型居然变成了一件靠经验反复试错的事儿。 这…

    2026年2月2日
    56100
  • 鸿蒙AI操作系统:打破应用壁垒,迈向L3级智能协同新纪元

    2025年无疑是终端AI全面爆发的元年,整个产业迎来了继功能机向智能机跃迁后的又一个十字路口。 这场跃迁是一次商业模式与交互逻辑的根本性重塑,智能机时代以APP为中心的被动服务模式,正在向以AI智能体为中心的主动服务模式跨越。在这场跃迁之中,如何重构人与设备的连接,成为摆在所有厂商面前的共同考题。 行业中,一派倾向于改良,试图在既有的APP生态上做加法;另一…

    2025年12月27日
    34900

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注