AI大神Andrej Karpathy开源92个高质量信息源:从nanoGPT到RSS订阅,打造深度学习知识体系

Andrej Karpathy 是 AI 领域公认的大神。他是 OpenAI 的创始成员,之后被马斯克挖走,领导了特斯拉自动驾驶团队。离开特斯拉后,他回到 OpenAI 参与了 GPT-4 的后续研发。

AI大神Andrej Karpathy开源92个高质量信息源:从nanoGPT到RSS订阅,打造深度学习知识体系

现在,他成立了一家 AI 教育公司 Eureka Labs,并经常在 X 和 YouTube 上活跃。如果你想学习 AI,尤其是技术原理,Andrej Karpathy 的 YouTube 频道是目前世界上最好的学习路径之一。

01 他的开源项目

① nanoGPT:极简主义的预训练标杆

nanoGPT 是 Karpathy 为了教学和研究而开发的最简约、最清晰的 GPT 训练库。它被公认为理解大语言模型原理的入门神作。它剥离了工业级代码中繁杂的工程包装,只保留 Transformer 架构最核心的逻辑。

AI大神Andrej Karpathy开源92个高质量信息源:从nanoGPT到RSS订阅,打造深度学习知识体系

通过这个项目,开发者可以清晰地看到一个类似 GPT-2 的模型是如何从零开始,通过 PyTorch 编写并在自己的数据上进行预训练的。

AI大神Andrej Karpathy开源92个高质量信息源:从nanoGPT到RSS订阅,打造深度学习知识体系

它的核心代码极其精炼,主要由两个约 300 行的文件组成:model.py 定义了复杂的 Transformer 数学结构,而 train.py 则实现了完整的训练循环。尽管代码量极小,但它完整支持了现代深度学习的关键技术,如分布式训练、混合精度加速(Flash Attention)以及与 OpenAI 官方权重的兼容。

② nanochat:从会写字到能聊天的全链路指南

这个拥有 4 万 Star 的开源项目,可以让你用约 100 美元的成本训练一个小型的 ChatGPT。

AI大神Andrej Karpathy开源92个高质量信息源:从nanoGPT到RSS订阅,打造深度学习知识体系

如果说 nanoGPT 关注的是预训练,让模型学会预测下一个字,那么 nanochat 则是进阶版的全栈式大模型训练框架。它不仅涵盖了预训练,还补齐了将原始模型转化为类似 ChatGPT 的对话模型所需的完整链路,包括:分词器训练、有监督微调和强化学习。

这个项目只用约 8000 行代码实现了一个端到端的系统,还自带了一个现成的 Web 聊天界面,让用户在训练结束后能立刻与自己的模型对话。

AI大神Andrej Karpathy开源92个高质量信息源:从nanoGPT到RSS订阅,打造深度学习知识体系

02 大神的信息源

最近,Andrej Karpathy 在自己的 X 上发帖,认为目前的社交媒体充斥着为了诱导点击和情绪而生成的 AI 垃圾内容。为了获取高质量、长篇且具有深度思考的内容,他强烈建议回归 RSS 订阅,并认为 RSS 是对抗信息茧房和算法操控的最后堡垒。

AI大神Andrej Karpathy开源92个高质量信息源:从nanoGPT到RSS订阅,打造深度学习知识体系

他个人主要使用 RSS 阅读器,去订阅那些由人类亲自撰写、具有长效价值的长篇文章,而不是被算法优化的碎片化短文。上面这个订阅源收集了 2025 年 Hacker News 上 92 个最受欢迎的博客,涵盖了深度技术探讨、编程艺术、数学以及科学研究。

Hacker News 是 Y Combinator 运营的新闻聚合网站,在科技界、程序员圈子和创业圈子中拥有极高的地位,被许多人视为获取高质量科技资讯和进行深度讨论的圣地。

03 如何像 Karpathy 一样获取信息?

① 下载 OPML 文件

首先需要打开上面的链接,将 OPML 文件下载到本地。

AI大神Andrej Karpathy开源92个高质量信息源:从nanoGPT到RSS订阅,打造深度学习知识体系

② 选择一个 RSS 订阅器

你可以选择开源的 RSS 订阅工具,例如 Folo

AI大神Andrej Karpathy开源92个高质量信息源:从nanoGPT到RSS订阅,打造深度学习知识体系

除了 Folo,你也可以使用其他的 RSS 阅读工具,比如 NetNewsWire

AI大神Andrej Karpathy开源92个高质量信息源:从nanoGPT到RSS订阅,打造深度学习知识体系

③ 导入 OPML 文件

在 RSS 阅读器中,导入刚刚下载的 OPML 文件即可。

AI大神Andrej Karpathy开源92个高质量信息源:从nanoGPT到RSS订阅,打造深度学习知识体系
AI大神Andrej Karpathy开源92个高质量信息源:从nanoGPT到RSS订阅,打造深度学习知识体系

导入成功后,你就能看到这些热门的博客列表了。

AI大神Andrej Karpathy开源92个高质量信息源:从nanoGPT到RSS订阅,打造深度学习知识体系

04 这个信息源包含什么?

这份信息源包含了许多高质量的博客,例如:

  • Simon Willison:Django 框架的联合创始人,现在专注于研究如何务实地使用 AI。不同于炒作概念的人,他会手写代码测试各种新模型,并分享详细的 Prompt 工程技巧、API 使用心得以及安全漏洞。

AI大神Andrej Karpathy开源92个高质量信息源:从nanoGPT到RSS订阅,打造深度学习知识体系

  • Neal Agarwal:他不做枯燥的技术分享,而是创作好玩的网页。他的代表作《Stimulation Clicker》(刺激点击器)是对现代互联网多巴胺成瘾的讽刺游戏。他的作品经常霸榜 Hacker News,展示了代码不仅可以用来创造工具,也可以用来创造快乐和艺术。

AI大神Andrej Karpathy开源92个高质量信息源:从nanoGPT到RSS订阅,打造深度学习知识体系

此外,还包括:
* 技术元老:如 Paul Graham(YC 创始人,文章不多但每篇必火)、John Gruber(专注苹果生态评论)。
* 底层技术大佬:如 Julia Evans(用漫画解释 Linux 内核/网络协议)。
* 数学与科学领域:如 Terence Tao(陶哲轩的博客,数学界顶流)。


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/archives/20991

(0)
上一篇 2天前
下一篇 2天前

相关推荐

  • GitHub宝藏:6款小众开源神器,从地图艺术到算法解密,提升你的技术工具箱

    地图海报生成器 这是一个基于 Python 的开源工具,可以将城市地图数据转化为极简风格的艺术海报。 该项目利用 OpenStreetMap 获取地理数据,并通过 Matplotlib 进行渲染,能够为世界上任何一座城市生成高分辨率的地图图像。 它无需复杂的地理信息软件界面,通过简洁的代码或命令行即可完成创作。工具内置了多种主题,如黑色电影、陶土和赛博朋克等…

    2026年2月5日
    1300
  • 本周GitHub精选:8个AI开源项目,从智能体UI到文档处理,全面提升开发效率

    Skills 开源合集 该项目由 Anthropic 发布并维护,在 GitHub 上已获得 28K Star。它汇集了多种可复用的“Skills”(技能包)。 Skills 本质上是将复杂的提示词、脚本、模板和资源打包成标准化的能力单元。在向 Claude 分派任务时,它可以动态加载并使用相关的 Skill。 该仓库提供了多种类型的 Skill 示例,涵盖…

    2025年12月28日
    11600
  • Gengram:16天实现基因组AI效率革命,外挂字典让模型推理速度飙升

    今年 1 月,DeepSeek 发布了一项名为 Engram(条件记忆)的技术,在大模型领域引起了广泛关注。 其核心思想非常直接:不让模型费力记忆所有常识,而是为其配备一个可随时查询的“外挂记忆库”。 具体实现上,它将常见的 N-gram(如“人工智能”、“光合作用”)预先存入一个哈希表。当模型需要时,直接查表即可获取相关信息,从而节省大量计算资源,使其能更…

    2026年1月31日
    7600
  • AI绘图革命:Next AI Draw.io一周斩获4500星,自然语言秒变专业图表

    Next AI Draw.io:一周斩获4500星,用自然语言秒变专业图表 在GitHub上,一个名为 Next AI Draw.io 的开源项目迅速走红,仅一周就获得了超过4500个Star,并登上了开源热榜。 如果你在工作中经常需要绘制流程图、架构图或UML图,又觉得传统的拖拽连线方式效率低下,那么这个项目或许能成为你的效率利器。 开源项目简介 Next…

    2025年12月18日
    21600
  • 三大前沿GitHub项目解析:云端IDE、开源游戏宝库与AI呼叫中心革新

    把 VS Code 装进浏览器 这个开源项目可以让你在浏览器里面写代码,它把 VS Code 完整地搬进浏览器中运行,现在已经 75K 的 Star 了。 code-server 让 VS Code 编辑器脱离本地电脑的环境,可以在任意服务器上运行,再通过浏览器访问。 这意味着你可以在一台 Linux 服务器上安装 code-server,然后从任何有浏览器…

    2025年11月22日
    11200