马斯克引爆社交平台:X开源广告系统和审查代码,3GB推荐模型直接跑

马斯克再次引爆社交媒体!𝕏 将社交平台向来讳莫如深的“广告系统”与“内容审查”代码,连同可直接运行的推荐模型,一股脑儿全部开源至GitHub。如今,6亿用户每天刷到的内容,将由Grok全权决定。

就在刚刚,马斯克宣布开源𝕏最新版的算法!

他仅用一句话官宣,便瞬间吸引了超过2700万网友围观。

马斯克引爆社交平台:X开源广告系统和审查代码,3GB推荐模型直接跑

此举之所以引发轰动,是因为社交平台有两项核心机密向来不对外公开:

第一,广告注入系统——堪称“印钞机”。
第二,内容审查管线——无异于“生死簿”。

而𝕏 这次不仅将这两者的源码,连同体积高达3GB的推荐模型,一股脑儿全部上传到了GitHub!

马斯克引爆社交平台:X开源广告系统和审查代码,3GB推荐模型直接跑

仓库地址:https://github.com/xai-org/x-algorithm

马斯克引爆社交平台:X开源广告系统和审查代码,3GB推荐模型直接跑

等等,𝕏 连广告代码也公开了?

早在1月19日,𝕏 就曾首次开源推荐算法。

当时公开的是Phoenix排名模型和Thunder信息流引擎,也就是决定“你打开‘为你推荐’会看到什么”的逻辑。

但广告系统的代码,一个字都没透露。

这次,全盘托出。

马斯克引爆社交平台:X开源广告系统和审查代码,3GB推荐模型直接跑

新增的 home-mixer/ads/ 目录中,包含了四个相关的Rust文件:

  • partition_organic_blender.rs:负责将广告与自然内容混合。
  • safe_gap_blender.rs:控制两条广告之间至少间隔多少条自然帖子。
  • ads_brand_safety_hydrator.rsads_brand_safety_vf_hydrator.rs:负责品牌安全,确保广告不会出现在暴力或色情内容旁边。

请注意关键词:blender,即混合器。

这意味着,广告并非硬性插入,而是与你发布的帖子、你关注的人发布的帖子一起排队、一起打分,然后依据规则混合。你刷到的每一条广告,都是在与相邻几条自然内容的“竞争”中胜出,才出现在那个位置的。

马斯克引爆社交平台:X开源广告系统和审查代码,3GB推荐模型直接跑

有个审帖工具,名字叫“deluxe”

另一个从未公开的组件是 grox/ 目录。

它专门负责帖子发布后、进入推荐前的那道“审查流水线”。

六个分类器各司其职:

  • spam.py:负责垃圾内容检测。
  • post_safety_screen_deluxe.py:负责安全审查(“豪华版”这个命名,很𝕏)。
  • safety_ptos.py:负责平台服务条款策略检查。
  • banger_initial_screen.py:负责爆款初筛,判断一条帖子是否“够炸”。
  • reply_ranking.py:负责回复排序。
  • classifier.py:负责通用内容分类。

其中,最有意思的是 banger_initial_screenbanger,即爆款。

也就是说,𝕏 的算法中专门有一个分类器用于判断“这条帖子够不够炸”,够炸的优先往前排。

马斯克引爆社交平台:X开源广告系统和审查代码,3GB推荐模型直接跑

整套Grox管线采用Python编写,与Rust编写的推荐系统主体形成了分层架构。其中,Rust负责毫秒级排序,Python则负责判断“这条内容该不该存在”。配套的还有Kafka数据加载器、ASR语音识别处理、帖子摘要生成器,以及一个调度引擎,将这些任务编排成不同的“plan”来运行。

3GB模型给你,拿去直接跑

技术圈最为兴奋的,可能是第三个变化。

以往开源推荐算法,你能看到逻辑,但跑不起来。没有模型权重,代码就是一堆空壳。

这次,𝕏 直接塞了一个预训练好的mini Phoenix模型:

Mini Phoenix Model
├── 嵌入维度: 256
├── 注意力头: 4
├── Transformer层数: 2
├── 模型体积: ~3 GB(Git LFS分发)
└── 推理入口: python run_pipeline.py(检索→排序,一行跑通)

只需一行命令,从检索到排序的完整推理流程就能跑通,pipeline结构与生产环境一模一样。

马斯克引爆社交平台:X开源广告系统和审查代码,3GB推荐模型直接跑

当然,mini模型的参数规模远小于线上版本。

但这已经是社交平台历史上,第一次有人把“能跑的模型”和“生产级代码”打包在一起公开。

马斯克引爆社交平台:X开源广告系统和审查代码,3GB推荐模型直接跑

一条帖子的生死,15个概率说了算

广告、审查、模型是这次最炸的三个新组件。但它们各自填补了推荐pipeline的具体位置。

1月那一版,pipeline六步中大部分只有骨架代码。

这次补全后,每一步都有了完整的Rust或Python实现。

Pipeline 六步                        1月有的          5月15日新增的
─────────────────────────────────────────────────────────────
[1] 用户画像                        无                17个query_hydrator
(Query Hydration)                                 (关注/屏蔽/话题/互关/IP/
Bloom过滤器/历史时间戳……)
[2] 候选召回                         Thunder          +Ads Source(广告)
(Candidate Sources)              Phoenix          +Phoenix MoE(混合专家)
                                                      +Phoenix Topics(话题)
                                                      +Who To Follow(推荐关注)
                                                      +Prompts Source(Grok提示)
[3] 特征填充                         基础版            +互动数/品牌安全/语言检测/
(Hydration)                                       媒体类型/视频时长/引用展开
[4] 打分前过滤                       基础版            +屏蔽词/已看过/付费权限/
(Pre-Scoring Filter)                              社交关系图谱过滤
[5] 打分 + 排序                      Phoenix Scorer   不变(下面展开)
[6] 打分后过滤 + 广告混排            基础版            +VF可见性检查
                                                      +会话去重
                                                      +完整ads blending模块

从2个候选源扩展到7个以上,从0个用户画像hydrator增加到17个。

整个 pipeline 从“能看”直接进化到了“能跑”。

马斯克引爆社交平台:X开源广告系统和审查代码,3GB推荐模型直接跑

这条 pipeline 的核心灵魂在于第五步的打分环节。

Phoenix 的 Grok Transformer 在给每一条帖子打分时,会同步预测 15 种用户行为的概率。

                        • *

正向行为(11种) 负向行为(4种)
────────────────────── ──────────────────
P(favorite) 点赞 P(not_interested) 不感兴趣
P(reply) 回复 P(block_author) 拉黑
P(repost) 转发 P(mute_author) 静音
P(quote) 引用 P(report) 举报
P(click) 点击
P(profile_click) 查看主页
P(video_view) 看视频
P(photo_expand) 展开图片
P(share) 分享
P(dwell) 停留浏览
P(follow_author) 关注作者

最终得分的计算规则如下:

        • *

Final Score = Σ (weight_i × P(action_i))
正向行为 → 正权重(加分)
负向行为 → 负权重(重扣)

这就像一场 15 道题的考试:11 道是加分题,4 道是送命题。

你的每一条帖子,都要经历这样一轮完整的评估。

We have eliminated every single hand-engineered feature and most heuristics from the system。

所有的手工规则都被彻底移除,100% 依靠 Transformer 端到端地自主学习。

马斯克引爆社交平台:X开源广告系统和审查代码,3GB推荐模型直接跑

打分机制中还有一个巧妙的设计,叫做“候选隔离”(Candidate Isolation)。

在 Transformer 推理时,候选帖子之间彼此“看不见”。

每一条帖子只能参考用户的历史行为,完全不知道同一批次里还有哪些其他帖子在竞争。

为什么这么做?

因为如果候选帖子互相影响,那么同一条帖子与 50 条候选一起输入,和与 500 条候选一起输入,最终得分就会截然不同。

𝕏 通过注意力掩码彻底切断了这种依赖关系,使得每条帖子的分数独立、稳定,并且可以缓存。

换句话说,这 15 种预测,并不是在猜测“这个人喜欢什么”,而是在判断你会做什么、不会做什么,以及做完之后会不会后悔。

你的 For You 页面,现在是一本摊开的书

如今,在全球主流社交平台中,𝕏 是唯一一个将推荐算法、广告系统以及内容审核管线全部公开在 GitHub 上的平台。

你的 For You 页面如何排序、广告如何混入、哪些内容会被屏蔽——所有这些,现在都有一套用 Rust 和 Python 写成的答案。

而且,这套推荐系统已经全面切换至 Grok Transformer 驱动,所有手工规则全部废除。

这意味着,xAI 的模型能力已经从聊天机器人领域,渗透到了 6 亿人每天的信息消费决策中。

推荐系统,或许是当下最具实权的 AI 应用场景。谁掌控了排序,谁就掌控了注意力。

有兴趣的话,可以 git clone 下来直接运行。

3GB 的模型,一条命令,你就能亲眼看到那 15 个概率是如何决定你每天刷到的内容。

参考资料:https://x.com/elonmusk/status/2055277918633562153


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/archives/34958

(0)
上一篇 7小时前
下一篇 7小时前

相关推荐

  • GitHub热门项目盘点:AI对冲基金、Agent平台与大模型书籍引领技术前沿

    AI 对冲基金团队 AI Hedge Fund 项目构建了一个由多个 AI 智能体组成的虚拟对冲基金团队,在 GitHub 上已获得超过 43K 星标。 其核心理念是利用大语言模型分别扮演不同的投资专家角色,例如巴菲特(价值投资)、凯瑟琳·伍德(成长型投资)和 Bill Ackman(激进投资)等。这些 AI 智能体协同工作,通过分析市场数据来制定交易决策。…

    2025年12月20日
    61700
  • OpenMythos开源:循环深度Transformer架构揭秘,用一半参数实现同等效果

    近期,一个名为OpenMythos的开源项目整合了公开研究及对Claude Mythos架构的主流推测,实现了一种创新的循环深度Transformer架构。 该架构名为循环深度Transformer,其核心在于通过跨专家的权重共享与条件计算实现迭代深度。已有研究证实,这种设计能以仅一半的参数量,达到与传统模型同等的性能。 核心思路:不堆叠参数,而增加循环 该…

    2026年4月21日
    48300
  • MiroFish:多智能体博弈推演,AI如何预见特斯拉财报走势?

    数月前,一款名为 BettaFish(微舆)的开源项目悄然崛起,其惊艳的多智能体分析系统打破了互联网信息茧房,随后连续多日霸榜 GitHub Trending。 在持续多轮的暴涨后,项目已累积斩获 34000+ Star,成为当之无愧的现象级爆款。 项目爆火后,这位 20 岁的开发者并未止步。基于 BettaFish 看清当下的能力,他希望更进一步,让 AI…

    2026年1月13日
    78700
  • Graphify:开源知识图谱工具,71.5倍Token节省,48小时实现卡神知识库完全体

    Graphify:开源知识图谱工具,实现71.5倍Token节省与全自动知识库构建 AI领域的迭代速度令人惊叹。在Karpathy分享其个人知识库方法论后仅48小时,开源社区便推出了一个功能完备的实现方案。 Graphify 是一款零配置、支持全模态、可本地运行的知识图谱工具,以其高效的Token节省能力在GitHub上迅速获得了超过2000颗星。 该工具不…

    2026年4月7日
    2.6K00
  • 国产AI开发平台BISHENG:GitHub斩获10K星,企业级LLM DevOps解决方案

    在浏览 GitHub 时,一个名为 BISHENG 的国产 AI 开源项目引起了我的注意。 这是一款主要面向企业的开源 AgentOps 平台。其名称源自活字印刷术的发明者——毕昇。活字印刷术曾极大地推动了人类知识的传播,而 BISHENG 团队的愿景,则是为智能应用的广泛落地提供有力支撑。 开源项目简介 BISHENG 已在 GitHub 上获得了超过 1…

    2025年11月24日
    65500