腾讯青云奖学金首秀：姚顺雨亲颁百万奖金，揭秘AI人才培养新战略

闻乐发自凹非寺

量子位 | 公众号 QbitAI

来围观腾讯青云奖学金颁奖，竟然偶遇了姚顺雨。

这位27岁的腾讯首席AI科学家，在腾讯大楼的线下公开亮相，不是发布重磅产品，也不是解读战略布局——而是给一群青年研究者颁发青云奖学金。

上一次他在公开场合露面还是在AGI-Next前沿峰会上。这波在腾讯的首秀确实“不按常理出牌”。

为更值得的探索

青云奖学金是腾讯针对顶尖技术人才的科研激励计划。通过为每位获奖者提供20万元现金和价值30万元的云异构算力资源，希望激发青年学者的创新潜能，推动人工智能领域的前沿突破。这次也是腾讯举办的青云奖学金的首届颁奖。

“从这些获奖者身上，我们看到了向上的力量和向善的温度，看到了青年学子敢于跨越已知边界、探索未知领域的勇气与实力。我们也期待年轻学子们能扎实向前，成为未来的科技领军人。”腾讯首席人才官奚丹说。

针对腾讯对于人才选拔的偏好，本量子位也进行了提问。

Q：选拔青云奖学金获得者时，腾讯最看重候选人的哪些特质？

腾讯全球招聘负责人罗海波：我们最看重的就是卓越的研究能力和深厚的学术造诣，前瞻性的科研事业，以及长期潜力和科研品位。做科研是一件孤独的事情，我们会比较关注学生这种底层的潜力。

此次姚顺雨通过青云计划奖学金颁奖完成他在腾讯的线下“首秀”，也释放出一个明确信号——腾讯正在持续加码AI人才培养。

本届15位获奖学生研究领域涵盖了多个前沿领域，以下为全部获奖名单。

获奖者们都说了些啥

另外，我们也和部分获奖的学生们聊了聊。

Q：首先想问一下，拿到青云奖金之后心情怎么样，会怎么支配呢？

董冠霆： 首届腾讯青云奖学金，我身边所有人都知道这个奖学金，第一反应都是非常难拿。然后钱的话，我这边可能后续如果要是有什么去学术交流，或者说是交换学术开会会议报销，学术类的一些经费就比较充足了，可以自由支配一下。

Q：我们之前也比较关注过，大模型安全这个方向，或者说是AI谄媚、骗人，所以说训练的时候就会按照人类的偏好来训练是吗？那会不会影响这个模型回答的客观性？

吉嘉铭： 对，因为我做的alignment，比如说里面一个很核心的方法的话是RLHF，其实就是基于人类反馈的强化学习，就是想把人类的偏好训到模型里面，它能够更按照我们意图回答，这个其实也是2022年这个ChatGPT的成功。

但是现在我们其实也会做这种真实性的对齐。就是其实现在的话，这种human preference的话，他们主要做啥呢？其实就是做我现在问一个问题模型有回答a和回答b，比如说他会定义一些维度来做这个人力偏好，比如说信息的完整度、信息的正确性以及信息的这种结构性，那这种偏好的话，其实也不会说那么的不客观。

我们这个研究方向其实在国外还挺受重视的。我之前也拿了那个苹果奖学金，他们就特别关心decision，因为他们认为就是前沿的技术，或者说前沿的模型的训练的钥匙是掌控在我们手上的，那我们一定要重视，就是在一个训练的过程中，模型可能出现的misalignment，这个misalignment的话可能会造成严重的社会影响。

那我们讲模型和人对齐，但是其实我们在用模型的过程中的话，也会潜移默化地向模型进行对齐。换句话而言的话，在大模型出来之前的话，我们看到所有的资讯、所有的稿子可能还是我们人写的，那现在大模型时代下的话，我们可能已经活在大模型的信息解耦里面了，在这种双向对齐造成的叫value lock in，就是价值锁定，其实还挺可怕的。

Q：最近Kimi出了一个新模型，它比较鲜明特点就是一个智能体集群。那你觉得这个智能体集群会是未来的一个主流的方向吗？

董冠霆： 多智能体其实是弥补单智能体缺陷的一个现在最简单的一个途径。但我其实来看的话，还是要把这些多智能体能力去集合到一个单智能体是比较强的，所以我觉得多智能体只是一个中间态的过程。

我觉得理想化的一个情况下一定是要做成一个单智能体，我认为现在其实是一个信息所谓瓶颈期，不是叫技术的瓶颈期导致，其实近半年来从R1开始。大家的基础没有一个很本质的提升，这在业界也是公认的，但更本质上还是要想办法如何把这些知识合版，或者说融合，有机地融合到一个模型。

Q：你们作为专业的学术人员，要是新推出一款智能体，会比较关注它的哪些能力呢？

胥嘉政： 比如现在我有代码智能code agent，有search agent，那其实for search、for code可能我要求的那期待的那个期望是不一样的，比如说如果你是给code agent，我可能希望你接到那个代码的工具里面能够帮我快速地提高我现在的效率。如果是search agent，可能我给你一个深度调研的任务，我希望你能够帮我找到需要的一些材料，而且你的这个引用是准的，你帮我找到的那些材料是我需要的，就是不同的智能体我对它有不同的期待。

Q：那如果说优化智能体的话，那你觉得什么方向上有很大的优化空间。

董冠霆： 这其实是我想问姚顺雨的问题，就我觉得智能体其实现在，大概两个方向，一个是简单来说从workflow去做框架对齐，一个是从训练角度去做，其实这两个方向各有很多的人去在做，有很多人坚信这两个方向都有它的意义。那其实我自己也想看到底哪个方向是更重要的，然后再往后的话可能我会更关注智能体的生成能力，就是我可能就像刚才嘉政说的，可能一个search agent我会期待它在search能力上有100分，但可能我现在更希望看到的是。在所有的智能体领域上有一个85分的能力，就是我更期待看到这样的东西，这种可能是更有通用愿景的一些东西。

白雨石： 我其实不太同意，我觉得就是我们肯定期待一个很强的基模，就是比如说像这种通用智能体的基模，最好就是说，同一个应用里可以支持又有这个agent，又有那个agent，但是它背后完全可以不是同一个模型。就是它们可以去绕到不同的模型，然后这些模型都是这种Domain-specific 去进行专业优化。比如说 PPT workflow可能它的workflow和code agent workflow可能不太一样，但是它们俩之间相似性其实还挺大。那如果把它如果要做一个这种deep research的workflow，那可能差距就会比较大，那我觉得这些是没有必要再必须要合成同一个。

聊完只能说，AI时代果然是一个百花齐放的时代……

关注“鲸栖”小程序，掌握最新AI资讯

本文来自网络搜集，不代表鲸林向海立场，如有侵权，联系删除。转载请注明出处：https://www.itsolotime.com/archives/19525

腾讯青云奖学金首秀：姚顺雨亲颁百万奖金，揭秘AI人才培养新战略

闻乐 发自 凹非寺

为更值得的探索

获奖者们都说了些啥

相关推荐

FARS全自动研究系统：228小时产出100篇论文，AI科研流水线实现工业级吞吐

马斯克发布Terafab项目：年产1太瓦算力，SpaceX与Tesla联手迈向星际文明

4款GitHub开源AI技能：视频剪辑、文本去AI化、小红书发布与技能管理工具

交错思维链：AI智能体突破长程规划瓶颈的关键机制

Meta AI基础设施十年演进：从GPU集群到自研芯片的下一代蓝图

闻乐发自凹非寺