AI大神Andrej Karpathy开源92个高质量信息源:从nanoGPT到RSS订阅,打造深度学习知识体系

Andrej Karpathy 是 AI 领域公认的大神。他是 OpenAI 的创始成员,之后被马斯克挖走,领导了特斯拉自动驾驶团队。离开特斯拉后,他回到 OpenAI 参与了 GPT-4 的后续研发。

AI大神Andrej Karpathy开源92个高质量信息源:从nanoGPT到RSS订阅,打造深度学习知识体系

现在,他成立了一家 AI 教育公司 Eureka Labs,并经常在 X 和 YouTube 上活跃。如果你想学习 AI,尤其是技术原理,Andrej Karpathy 的 YouTube 频道是目前世界上最好的学习路径之一。

01 他的开源项目

① nanoGPT:极简主义的预训练标杆

nanoGPT 是 Karpathy 为了教学和研究而开发的最简约、最清晰的 GPT 训练库。它被公认为理解大语言模型原理的入门神作。它剥离了工业级代码中繁杂的工程包装,只保留 Transformer 架构最核心的逻辑。

AI大神Andrej Karpathy开源92个高质量信息源:从nanoGPT到RSS订阅,打造深度学习知识体系

通过这个项目,开发者可以清晰地看到一个类似 GPT-2 的模型是如何从零开始,通过 PyTorch 编写并在自己的数据上进行预训练的。

AI大神Andrej Karpathy开源92个高质量信息源:从nanoGPT到RSS订阅,打造深度学习知识体系

它的核心代码极其精炼,主要由两个约 300 行的文件组成:model.py 定义了复杂的 Transformer 数学结构,而 train.py 则实现了完整的训练循环。尽管代码量极小,但它完整支持了现代深度学习的关键技术,如分布式训练、混合精度加速(Flash Attention)以及与 OpenAI 官方权重的兼容。

② nanochat:从会写字到能聊天的全链路指南

这个拥有 4 万 Star 的开源项目,可以让你用约 100 美元的成本训练一个小型的 ChatGPT。

AI大神Andrej Karpathy开源92个高质量信息源:从nanoGPT到RSS订阅,打造深度学习知识体系

如果说 nanoGPT 关注的是预训练,让模型学会预测下一个字,那么 nanochat 则是进阶版的全栈式大模型训练框架。它不仅涵盖了预训练,还补齐了将原始模型转化为类似 ChatGPT 的对话模型所需的完整链路,包括:分词器训练、有监督微调和强化学习。

这个项目只用约 8000 行代码实现了一个端到端的系统,还自带了一个现成的 Web 聊天界面,让用户在训练结束后能立刻与自己的模型对话。

AI大神Andrej Karpathy开源92个高质量信息源:从nanoGPT到RSS订阅,打造深度学习知识体系

02 大神的信息源

最近,Andrej Karpathy 在自己的 X 上发帖,认为目前的社交媒体充斥着为了诱导点击和情绪而生成的 AI 垃圾内容。为了获取高质量、长篇且具有深度思考的内容,他强烈建议回归 RSS 订阅,并认为 RSS 是对抗信息茧房和算法操控的最后堡垒。

AI大神Andrej Karpathy开源92个高质量信息源:从nanoGPT到RSS订阅,打造深度学习知识体系

他个人主要使用 RSS 阅读器,去订阅那些由人类亲自撰写、具有长效价值的长篇文章,而不是被算法优化的碎片化短文。上面这个订阅源收集了 2025 年 Hacker News 上 92 个最受欢迎的博客,涵盖了深度技术探讨、编程艺术、数学以及科学研究。

Hacker News 是 Y Combinator 运营的新闻聚合网站,在科技界、程序员圈子和创业圈子中拥有极高的地位,被许多人视为获取高质量科技资讯和进行深度讨论的圣地。

03 如何像 Karpathy 一样获取信息?

① 下载 OPML 文件

首先需要打开上面的链接,将 OPML 文件下载到本地。

AI大神Andrej Karpathy开源92个高质量信息源:从nanoGPT到RSS订阅,打造深度学习知识体系

② 选择一个 RSS 订阅器

你可以选择开源的 RSS 订阅工具,例如 Folo

AI大神Andrej Karpathy开源92个高质量信息源:从nanoGPT到RSS订阅,打造深度学习知识体系

除了 Folo,你也可以使用其他的 RSS 阅读工具,比如 NetNewsWire

AI大神Andrej Karpathy开源92个高质量信息源:从nanoGPT到RSS订阅,打造深度学习知识体系

③ 导入 OPML 文件

在 RSS 阅读器中,导入刚刚下载的 OPML 文件即可。

AI大神Andrej Karpathy开源92个高质量信息源:从nanoGPT到RSS订阅,打造深度学习知识体系
AI大神Andrej Karpathy开源92个高质量信息源:从nanoGPT到RSS订阅,打造深度学习知识体系

导入成功后,你就能看到这些热门的博客列表了。

AI大神Andrej Karpathy开源92个高质量信息源:从nanoGPT到RSS订阅,打造深度学习知识体系

04 这个信息源包含什么?

这份信息源包含了许多高质量的博客,例如:

  • Simon Willison:Django 框架的联合创始人,现在专注于研究如何务实地使用 AI。不同于炒作概念的人,他会手写代码测试各种新模型,并分享详细的 Prompt 工程技巧、API 使用心得以及安全漏洞。

AI大神Andrej Karpathy开源92个高质量信息源:从nanoGPT到RSS订阅,打造深度学习知识体系

  • Neal Agarwal:他不做枯燥的技术分享,而是创作好玩的网页。他的代表作《Stimulation Clicker》(刺激点击器)是对现代互联网多巴胺成瘾的讽刺游戏。他的作品经常霸榜 Hacker News,展示了代码不仅可以用来创造工具,也可以用来创造快乐和艺术。

AI大神Andrej Karpathy开源92个高质量信息源:从nanoGPT到RSS订阅,打造深度学习知识体系

此外,还包括:
* 技术元老:如 Paul Graham(YC 创始人,文章不多但每篇必火)、John Gruber(专注苹果生态评论)。
* 底层技术大佬:如 Julia Evans(用漫画解释 Linux 内核/网络协议)。
* 数学与科学领域:如 Terence Tao(陶哲轩的博客,数学界顶流)。


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/archives/20991

(0)
上一篇 2026年2月10日 下午12:56
下一篇 2026年2月10日 下午2:54

相关推荐

  • OpenAI稀疏电路研究:为破解大模型黑箱提供可解释性新路径

    在人工智能领域,大模型的“黑箱”问题一直是制约其可信应用的核心障碍。OpenAI最新发布的研究论文《Circuit Sparsity in Neural Networks》通过训练结构更简单、连接更稀疏的神经网络,为构建既强大又透明的模型提供了全新方向。这一突破性进展不仅揭示了神经网络内部的可解释性机制,更可能成为未来AI系统安全部署的关键技术基础。 研究团…

    2025年11月14日
    31900
  • 无界动力获5亿天使融资:具身智能赛道迎来技术-产业双栖领军者

    近日,具身智能领域迎来重磅融资消息——新创公司无界动力宣布完成累计超5亿元的天使轮融资,由红杉中国、线性资本领投,高瓴创投、地平线、华业天成等多家顶级机构跟投。这一融资事件不仅刷新了该赛道早期融资纪录,更因其创始人张玉峰独特的产业背景与团队配置,引发了业界对具身智能商业化路径的深度思考。 从技术演进视角看,具身智能正从实验室概念迈向产业化临界点。无界动力提出…

    2025年11月10日
    40400
  • 从通用到专业:Libcom工作台如何重塑图像合成领域的精准编辑范式

    在2025年AIGC技术持续爆发的浪潮中,图像生成与编辑已成为数字内容创作的核心驱动力。从社交媒体的个性化头像到电商平台的动态海报,再到影视行业的预可视化分镜,AI生成内容正以前所未有的速度渗透至日常创作的各个环节。以Nano Banana、Qwen Edit为代表的通用图像编辑大模型凭借其强大的泛化能力,覆盖了从基础修图到复杂场景构建的广泛需求。特别是Na…

    2025年11月25日
    33600
  • 操作系统级AI融合:夸克浏览器全面集成千问助手,开启PC生产力新纪元

    在AI技术快速演进的浪潮中,浏览器作为互联网的核心入口,正经历从信息工具向智能助手的深刻转型。近日,夸克浏览器宣布全面升级为AI浏览器,深度集成阿里千问大模型,实现了操作系统级的全局AI唤起能力,标志着PC端生产力工具正式迈入智能伴随时代。这一变革不仅重塑了用户与浏览器的交互方式,更可能重新定义未来工作与学习的效率边界。 当前,PC场景仍是深度思考、复杂创作…

    2025年11月27日
    34600
  • 从GDPS 2025看中国具身智能的产业化领先:为何全球目光聚焦上海?

    近期,上海举办的GDPS 2025(全球开发者先锋大会暨国际具身智能技能大赛)引发了国际科技社区的广泛关注,尤其是美国网友对中国机器人应急救援比赛、规模化部署能力的讨论,折射出全球具身智能竞争格局的微妙变化。这一现象背后,是中国在具身智能产业化路径上的实质性突破,而上海作为产业集聚地,正通过完整的生态体系推动技术从实验室走向真实场景。 首先,GDPS 202…

    2025年12月12日
    33600