腾讯青云奖学金首秀:姚顺雨亲颁百万奖金,揭秘AI人才培养新战略

闻乐 发自 凹非寺

量子位 | 公众号 QbitAI

来围观腾讯青云奖学金颁奖,竟然偶遇了姚顺雨。

腾讯青云奖学金首秀:姚顺雨亲颁百万奖金,揭秘AI人才培养新战略

这位27岁的腾讯首席AI科学家,在腾讯大楼的线下公开亮相,不是发布重磅产品,也不是解读战略布局——而是给一群青年研究者颁发青云奖学金

腾讯青云奖学金首秀:姚顺雨亲颁百万奖金,揭秘AI人才培养新战略

上一次他在公开场合露面还是在AGI-Next前沿峰会上。这波在腾讯的首秀确实“不按常理出牌”。

为更值得的探索

青云奖学金是腾讯针对顶尖技术人才的科研激励计划。通过为每位获奖者提供20万元现金和价值30万元的云异构算力资源,希望激发青年学者的创新潜能,推动人工智能领域的前沿突破。这次也是腾讯举办的青云奖学金的首届颁奖。

“从这些获奖者身上,我们看到了向上的力量和向善的温度,看到了青年学子敢于跨越已知边界、探索未知领域的勇气与实力。我们也期待年轻学子们能扎实向前,成为未来的科技领军人。”腾讯首席人才官奚丹说。

腾讯青云奖学金首秀:姚顺雨亲颁百万奖金,揭秘AI人才培养新战略

针对腾讯对于人才选拔的偏好,本量子位也进行了提问。

Q:选拔青云奖学金获得者时,腾讯最看重候选人的哪些特质?

腾讯全球招聘负责人罗海波:我们最看重的就是卓越的研究能力和深厚的学术造诣,前瞻性的科研事业,以及长期潜力和科研品位。做科研是一件孤独的事情,我们会比较关注学生这种底层的潜力。

腾讯青云奖学金首秀:姚顺雨亲颁百万奖金,揭秘AI人才培养新战略

此次姚顺雨通过青云计划奖学金颁奖完成他在腾讯的线下“首秀”,也释放出一个明确信号——腾讯正在持续加码AI人才培养

本届15位获奖学生研究领域涵盖了多个前沿领域,以下为全部获奖名单。

腾讯青云奖学金首秀:姚顺雨亲颁百万奖金,揭秘AI人才培养新战略 腾讯青云奖学金首秀:姚顺雨亲颁百万奖金,揭秘AI人才培养新战略

获奖者们都说了些啥

另外,我们也和部分获奖的学生们聊了聊。

Q:首先想问一下,拿到青云奖金之后心情怎么样,会怎么支配呢?

董冠霆: 首届腾讯青云奖学金,我身边所有人都知道这个奖学金,第一反应都是非常难拿。然后钱的话,我这边可能后续如果要是有什么去学术交流,或者说是交换学术开会会议报销,学术类的一些经费就比较充足了,可以自由支配一下。

Q:我们之前也比较关注过,大模型安全这个方向,或者说是AI谄媚、骗人,所以说训练的时候就会按照人类的偏好来训练是吗?那会不会影响这个模型回答的客观性?

吉嘉铭: 对,因为我做的alignment,比如说里面一个很核心的方法的话是RLHF,其实就是基于人类反馈的强化学习,就是想把人类的偏好训到模型里面,它能够更按照我们意图回答,这个其实也是2022年这个ChatGPT的成功。

但是现在我们其实也会做这种真实性的对齐。就是其实现在的话,这种human preference的话,他们主要做啥呢?其实就是做我现在问一个问题模型有回答a和回答b,比如说他会定义一些维度来做这个人力偏好,比如说信息的完整度、信息的正确性以及信息的这种结构性,那这种偏好的话,其实也不会说那么的不客观。

我们这个研究方向其实在国外还挺受重视的。我之前也拿了那个苹果奖学金,他们就特别关心decision,因为他们认为就是前沿的技术,或者说前沿的模型的训练的钥匙是掌控在我们手上的,那我们一定要重视,就是在一个训练的过程中,模型可能出现的misalignment,这个misalignment的话可能会造成严重的社会影响。

那我们讲模型和人对齐,但是其实我们在用模型的过程中的话,也会潜移默化地向模型进行对齐。换句话而言的话,在大模型出来之前的话,我们看到所有的资讯、所有的稿子可能还是我们人写的,那现在大模型时代下的话,我们可能已经活在大模型的信息解耦里面了,在这种双向对齐造成的叫value lock in,就是价值锁定,其实还挺可怕的。

Q:最近Kimi出了一个新模型,它比较鲜明特点就是一个智能体集群。那你觉得这个智能体集群会是未来的一个主流的方向吗?

董冠霆: 多智能体其实是弥补单智能体缺陷的一个现在最简单的一个途径。但我其实来看的话,还是要把这些多智能体能力去集合到一个单智能体是比较强的,所以我觉得多智能体只是一个中间态的过程。

我觉得理想化的一个情况下一定是要做成一个单智能体,我认为现在其实是一个信息所谓瓶颈期,不是叫技术的瓶颈期导致,其实近半年来从R1开始。大家的基础没有一个很本质的提升,这在业界也是公认的,但更本质上还是要想办法如何把这些知识合版,或者说融合,有机地融合到一个模型。

Q:你们作为专业的学术人员,要是新推出一款智能体,会比较关注它的哪些能力呢?

胥嘉政: 比如现在我有代码智能code agent,有search agent,那其实for search、for code可能我要求的那期待的那个期望是不一样的,比如说如果你是给code agent,我可能希望你接到那个代码的工具里面能够帮我快速地提高我现在的效率。如果是search agent,可能我给你一个深度调研的任务,我希望你能够帮我找到需要的一些材料,而且你的这个引用是准的,你帮我找到的那些材料是我需要的,就是不同的智能体我对它有不同的期待。

Q:那如果说优化智能体的话,那你觉得什么方向上有很大的优化空间。

董冠霆: 这其实是我想问姚顺雨的问题,就我觉得智能体其实现在,大概两个方向,一个是简单来说从workflow去做框架对齐,一个是从训练角度去做,其实这两个方向各有很多的人去在做,有很多人坚信这两个方向都有它的意义。那其实我自己也想看到底哪个方向是更重要的,然后再往后的话可能我会更关注智能体的生成能力,就是我可能就像刚才嘉政说的,可能一个search agent我会期待它在search能力上有100分,但可能我现在更希望看到的是。在所有的智能体领域上有一个85分的能力,就是我更期待看到这样的东西,这种可能是更有通用愿景的一些东西。

白雨石: 我其实不太同意,我觉得就是我们肯定期待一个很强的基模,就是比如说像这种通用智能体的基模,最好就是说,同一个应用里可以支持又有这个agent,又有那个agent,但是它背后完全可以不是同一个模型。就是它们可以去绕到不同的模型,然后这些模型都是这种Domain-specific 去进行专业优化。比如说 PPT workflow可能它的workflow和code agent workflow可能不太一样,但是它们俩之间相似性其实还挺大。那如果把它如果要做一个这种deep research的workflow,那可能差距就会比较大,那我觉得这些是没有必要再必须要合成同一个。

聊完只能说,AI时代果然是一个百花齐放的时代……


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:http://www.itsolotime.com/archives/19525

(0)
上一篇 2026年1月31日 下午12:01
下一篇 2026年1月31日 下午1:17

相关推荐

  • DSPy 3与GEPA:革新RAG框架的自动推理与提示进化技术

    近期,OpenAI 发布了 GPT-5.2 模型,引发了广泛关注。路透社报道称,OpenAI 在竞争压力下加速了研发进程。此次更新并非功能堆砌,而是聚焦于在智能、代码处理、长文本理解等核心能力上的显著提升,尤其擅长处理创建电子表格、制作演示文稿等复杂的多步骤任务。 简而言之,GPT-5.2 是一次面向实用场景的“精修”,在可靠性、长上下文处理、工具执行和输出…

    2026年1月20日
    14200
  • 操作系统级AI融合:夸克浏览器全面集成千问助手,开启PC生产力新纪元

    在AI技术快速演进的浪潮中,浏览器作为互联网的核心入口,正经历从信息工具向智能助手的深刻转型。近日,夸克浏览器宣布全面升级为AI浏览器,深度集成阿里千问大模型,实现了操作系统级的全局AI唤起能力,标志着PC端生产力工具正式迈入智能伴随时代。这一变革不仅重塑了用户与浏览器的交互方式,更可能重新定义未来工作与学习的效率边界。 当前,PC场景仍是深度思考、复杂创作…

    2025年11月27日
    14900
  • DeepPHY基准揭示多模态大模型物理推理能力鸿沟:从静态理解到动态交互的挑战

    近日,淘天集团算法技术-未来生活实验室团队提出的DeepPHY基准框架,作为首个系统性评估多模态大模型(VLM)交互式物理推理能力的综合基准,被AAAI 2026收录。该研究通过六个极具挑战性的物理模拟环境,揭示了即便是顶尖VLM,在将物理知识转化为精确、可预测的交互控制时,仍存在显著的核心短板。这一发现不仅对VLM在动态环境中的应用提出了严峻挑战,也为未来…

    2025年11月16日
    14800
  • 从“不作恶”到“战争机器”:谷歌GenAI.mil上线背后的七年剧变与AI军事化浪潮

    从2018年数千员工抗议军事AI项目,到2025年全面接入五角大楼推出GenAI.mil平台,谷歌用七年时间完成了一场深刻的战略转型。这一转变不仅关乎一家科技巨头的商业选择,更折射出人工智能技术与地缘政治、军事战略深度融合的时代趋势。前天,五角大楼的众多屏幕上同时弹出了一条弹窗通知,一行字赫然在目:「用美国前沿AI扩展战略优势」。 昨日,美国战争部发表官方公…

    2025年12月10日
    14200
  • 从理性到语感:vibe coding如何重塑编程范式与人类语言

    当《柯林斯词典》将「vibe coding」列为2025年度词汇时,这不仅是技术领域的里程碑,更是人类与机器交互方式发生根本性转变的文化信号。这个从程序员社区诞生的词汇,如今被正式定义为「用自然语言提示,让AI协助编写计算机代码的行为」,标志着编程从纯粹的逻辑运算向直觉驱动的协作模式演进。 **技术演进:从工具到协作者的范式转移** 传统编程建立在严格的语法…

    2025年11月10日
    14300