腾讯青云奖学金首秀:姚顺雨亲颁百万奖金,揭秘AI人才培养新战略

闻乐 发自 凹非寺

量子位 | 公众号 QbitAI

来围观腾讯青云奖学金颁奖,竟然偶遇了姚顺雨。

腾讯青云奖学金首秀:姚顺雨亲颁百万奖金,揭秘AI人才培养新战略

这位27岁的腾讯首席AI科学家,在腾讯大楼的线下公开亮相,不是发布重磅产品,也不是解读战略布局——而是给一群青年研究者颁发青云奖学金

腾讯青云奖学金首秀:姚顺雨亲颁百万奖金,揭秘AI人才培养新战略

上一次他在公开场合露面还是在AGI-Next前沿峰会上。这波在腾讯的首秀确实“不按常理出牌”。

为更值得的探索

青云奖学金是腾讯针对顶尖技术人才的科研激励计划。通过为每位获奖者提供20万元现金和价值30万元的云异构算力资源,希望激发青年学者的创新潜能,推动人工智能领域的前沿突破。这次也是腾讯举办的青云奖学金的首届颁奖。

“从这些获奖者身上,我们看到了向上的力量和向善的温度,看到了青年学子敢于跨越已知边界、探索未知领域的勇气与实力。我们也期待年轻学子们能扎实向前,成为未来的科技领军人。”腾讯首席人才官奚丹说。

腾讯青云奖学金首秀:姚顺雨亲颁百万奖金,揭秘AI人才培养新战略

针对腾讯对于人才选拔的偏好,本量子位也进行了提问。

Q:选拔青云奖学金获得者时,腾讯最看重候选人的哪些特质?

腾讯全球招聘负责人罗海波:我们最看重的就是卓越的研究能力和深厚的学术造诣,前瞻性的科研事业,以及长期潜力和科研品位。做科研是一件孤独的事情,我们会比较关注学生这种底层的潜力。

腾讯青云奖学金首秀:姚顺雨亲颁百万奖金,揭秘AI人才培养新战略

此次姚顺雨通过青云计划奖学金颁奖完成他在腾讯的线下“首秀”,也释放出一个明确信号——腾讯正在持续加码AI人才培养

本届15位获奖学生研究领域涵盖了多个前沿领域,以下为全部获奖名单。

腾讯青云奖学金首秀:姚顺雨亲颁百万奖金,揭秘AI人才培养新战略 腾讯青云奖学金首秀:姚顺雨亲颁百万奖金,揭秘AI人才培养新战略

获奖者们都说了些啥

另外,我们也和部分获奖的学生们聊了聊。

Q:首先想问一下,拿到青云奖金之后心情怎么样,会怎么支配呢?

董冠霆: 首届腾讯青云奖学金,我身边所有人都知道这个奖学金,第一反应都是非常难拿。然后钱的话,我这边可能后续如果要是有什么去学术交流,或者说是交换学术开会会议报销,学术类的一些经费就比较充足了,可以自由支配一下。

Q:我们之前也比较关注过,大模型安全这个方向,或者说是AI谄媚、骗人,所以说训练的时候就会按照人类的偏好来训练是吗?那会不会影响这个模型回答的客观性?

吉嘉铭: 对,因为我做的alignment,比如说里面一个很核心的方法的话是RLHF,其实就是基于人类反馈的强化学习,就是想把人类的偏好训到模型里面,它能够更按照我们意图回答,这个其实也是2022年这个ChatGPT的成功。

但是现在我们其实也会做这种真实性的对齐。就是其实现在的话,这种human preference的话,他们主要做啥呢?其实就是做我现在问一个问题模型有回答a和回答b,比如说他会定义一些维度来做这个人力偏好,比如说信息的完整度、信息的正确性以及信息的这种结构性,那这种偏好的话,其实也不会说那么的不客观。

我们这个研究方向其实在国外还挺受重视的。我之前也拿了那个苹果奖学金,他们就特别关心decision,因为他们认为就是前沿的技术,或者说前沿的模型的训练的钥匙是掌控在我们手上的,那我们一定要重视,就是在一个训练的过程中,模型可能出现的misalignment,这个misalignment的话可能会造成严重的社会影响。

那我们讲模型和人对齐,但是其实我们在用模型的过程中的话,也会潜移默化地向模型进行对齐。换句话而言的话,在大模型出来之前的话,我们看到所有的资讯、所有的稿子可能还是我们人写的,那现在大模型时代下的话,我们可能已经活在大模型的信息解耦里面了,在这种双向对齐造成的叫value lock in,就是价值锁定,其实还挺可怕的。

Q:最近Kimi出了一个新模型,它比较鲜明特点就是一个智能体集群。那你觉得这个智能体集群会是未来的一个主流的方向吗?

董冠霆: 多智能体其实是弥补单智能体缺陷的一个现在最简单的一个途径。但我其实来看的话,还是要把这些多智能体能力去集合到一个单智能体是比较强的,所以我觉得多智能体只是一个中间态的过程。

我觉得理想化的一个情况下一定是要做成一个单智能体,我认为现在其实是一个信息所谓瓶颈期,不是叫技术的瓶颈期导致,其实近半年来从R1开始。大家的基础没有一个很本质的提升,这在业界也是公认的,但更本质上还是要想办法如何把这些知识合版,或者说融合,有机地融合到一个模型。

Q:你们作为专业的学术人员,要是新推出一款智能体,会比较关注它的哪些能力呢?

胥嘉政: 比如现在我有代码智能code agent,有search agent,那其实for search、for code可能我要求的那期待的那个期望是不一样的,比如说如果你是给code agent,我可能希望你接到那个代码的工具里面能够帮我快速地提高我现在的效率。如果是search agent,可能我给你一个深度调研的任务,我希望你能够帮我找到需要的一些材料,而且你的这个引用是准的,你帮我找到的那些材料是我需要的,就是不同的智能体我对它有不同的期待。

Q:那如果说优化智能体的话,那你觉得什么方向上有很大的优化空间。

董冠霆: 这其实是我想问姚顺雨的问题,就我觉得智能体其实现在,大概两个方向,一个是简单来说从workflow去做框架对齐,一个是从训练角度去做,其实这两个方向各有很多的人去在做,有很多人坚信这两个方向都有它的意义。那其实我自己也想看到底哪个方向是更重要的,然后再往后的话可能我会更关注智能体的生成能力,就是我可能就像刚才嘉政说的,可能一个search agent我会期待它在search能力上有100分,但可能我现在更希望看到的是。在所有的智能体领域上有一个85分的能力,就是我更期待看到这样的东西,这种可能是更有通用愿景的一些东西。

白雨石: 我其实不太同意,我觉得就是我们肯定期待一个很强的基模,就是比如说像这种通用智能体的基模,最好就是说,同一个应用里可以支持又有这个agent,又有那个agent,但是它背后完全可以不是同一个模型。就是它们可以去绕到不同的模型,然后这些模型都是这种Domain-specific 去进行专业优化。比如说 PPT workflow可能它的workflow和code agent workflow可能不太一样,但是它们俩之间相似性其实还挺大。那如果把它如果要做一个这种deep research的workflow,那可能差距就会比较大,那我觉得这些是没有必要再必须要合成同一个。

聊完只能说,AI时代果然是一个百花齐放的时代……


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:http://www.itsolotime.com/archives/19525

(0)
上一篇 1天前
下一篇 1天前

相关推荐

  • AI驱动PC产业新周期:联想财报揭示硬件巨头的智能化转型路径

    近期IDC发布的2025年第三季度全球PC出货量数据显示,市场总量达到7590万台,同比增长9.4%,实现连续四个季度的正增长。这一数据有力驳斥了“PC行业触顶论”,表明在AI技术赋能下,传统硬件产业正迎来结构性复苏。作为行业风向标的联想集团,其最新财报更揭示了AI如何重塑PC价值链,推动硬件制造商向智能化服务商转型。 联想2025/26财年第二财季财报显示…

    2025年11月23日
    8500
  • 智元机器人量产破5000台:具身智能商业化进程加速,三大产线全面落地工业与消费场景

    智元机器人近日宣布第5000台通用具身机器人正式量产下线,这一里程碑事件不仅标志着该公司在短短三年内实现了从创业到规模化生产的跨越,更折射出中国具身智能产业商业化进程的显著提速。作为由“天才少年”彭志辉创立的硬核科技企业,智元以5000台的量产规模,提前触及了行业机构对2025年中国人形机器人商用出货量的预测值,预示着具身智能的量产元年可能比预期更早到来。 …

    2025年12月9日
    9900
  • LeCun领衔AI革命:世界模型挑战Next-token范式,构建真实世界智能体

    自从图灵奖得主 Yann LeCun 离开 Meta 创立 AMI Labs(Advanced Machine Intelligence)以来,这家新公司便引发了业界的高度关注。本周,他们终于确认了核心方向:开发所谓的「世界模型(world models)」,以此构建能够理解现实世界的智能系统。 一直以来,LeCun 都对现有大语言模型的发展持怀疑态度,认为…

    2026年1月24日
    4000
  • 破折号成瘾:AI写作风格如何暴露大模型训练数据的历史断层

    在人工智能写作领域,一个看似微不足道的标点符号——破折号——正成为揭示大模型训练数据来源与时代局限性的关键线索。用户普遍观察到,以ChatGPT为代表的AI产品在生成文本时频繁使用破折号,这种现象已从偶然特征演变为AI写作的标志性风格。OpenAI甚至将“减少破折号使用”作为产品改进功能单独发布,反映出用户对此现象的普遍关注。这一现象背后,隐藏着大模型训练数…

    2025年11月29日
    7800
  • Kimi神秘模型Kiwi-do现身竞技场:融资35亿后,多模态K2-VL即将登场?

    克雷西 发自 凹非寺 量子位 | 公众号 QbitAI 融资35亿后,Kimi的新模型紧跟着就要来了?! 大模型竞技场上,一个名叫Kiwi-do 的神秘模型悄然出现。 发现这个新模型的推特网友询问了模型的身份,结果模型自报家门,表示自己来自月之暗面Kimi,训练数据截止到2025年1月。 另有网友表示,Kiwi-do表现出了一些有趣的结果,尤其是在竞技场当中…

    2026年1月5日
    8800