AI大神Andrej Karpathy开源92个高质量信息源:从nanoGPT到RSS订阅,打造深度学习知识体系

Andrej Karpathy 是 AI 领域公认的大神。他是 OpenAI 的创始成员,之后被马斯克挖走,领导了特斯拉自动驾驶团队。离开特斯拉后,他回到 OpenAI 参与了 GPT-4 的后续研发。

AI大神Andrej Karpathy开源92个高质量信息源:从nanoGPT到RSS订阅,打造深度学习知识体系

现在,他成立了一家 AI 教育公司 Eureka Labs,并经常在 X 和 YouTube 上活跃。如果你想学习 AI,尤其是技术原理,Andrej Karpathy 的 YouTube 频道是目前世界上最好的学习路径之一。

01 他的开源项目

① nanoGPT:极简主义的预训练标杆

nanoGPT 是 Karpathy 为了教学和研究而开发的最简约、最清晰的 GPT 训练库。它被公认为理解大语言模型原理的入门神作。它剥离了工业级代码中繁杂的工程包装,只保留 Transformer 架构最核心的逻辑。

AI大神Andrej Karpathy开源92个高质量信息源:从nanoGPT到RSS订阅,打造深度学习知识体系

通过这个项目,开发者可以清晰地看到一个类似 GPT-2 的模型是如何从零开始,通过 PyTorch 编写并在自己的数据上进行预训练的。

AI大神Andrej Karpathy开源92个高质量信息源:从nanoGPT到RSS订阅,打造深度学习知识体系

它的核心代码极其精炼,主要由两个约 300 行的文件组成:model.py 定义了复杂的 Transformer 数学结构,而 train.py 则实现了完整的训练循环。尽管代码量极小,但它完整支持了现代深度学习的关键技术,如分布式训练、混合精度加速(Flash Attention)以及与 OpenAI 官方权重的兼容。

② nanochat:从会写字到能聊天的全链路指南

这个拥有 4 万 Star 的开源项目,可以让你用约 100 美元的成本训练一个小型的 ChatGPT。

AI大神Andrej Karpathy开源92个高质量信息源:从nanoGPT到RSS订阅,打造深度学习知识体系

如果说 nanoGPT 关注的是预训练,让模型学会预测下一个字,那么 nanochat 则是进阶版的全栈式大模型训练框架。它不仅涵盖了预训练,还补齐了将原始模型转化为类似 ChatGPT 的对话模型所需的完整链路,包括:分词器训练、有监督微调和强化学习。

这个项目只用约 8000 行代码实现了一个端到端的系统,还自带了一个现成的 Web 聊天界面,让用户在训练结束后能立刻与自己的模型对话。

AI大神Andrej Karpathy开源92个高质量信息源:从nanoGPT到RSS订阅,打造深度学习知识体系

02 大神的信息源

最近,Andrej Karpathy 在自己的 X 上发帖,认为目前的社交媒体充斥着为了诱导点击和情绪而生成的 AI 垃圾内容。为了获取高质量、长篇且具有深度思考的内容,他强烈建议回归 RSS 订阅,并认为 RSS 是对抗信息茧房和算法操控的最后堡垒。

AI大神Andrej Karpathy开源92个高质量信息源:从nanoGPT到RSS订阅,打造深度学习知识体系

他个人主要使用 RSS 阅读器,去订阅那些由人类亲自撰写、具有长效价值的长篇文章,而不是被算法优化的碎片化短文。上面这个订阅源收集了 2025 年 Hacker News 上 92 个最受欢迎的博客,涵盖了深度技术探讨、编程艺术、数学以及科学研究。

Hacker News 是 Y Combinator 运营的新闻聚合网站,在科技界、程序员圈子和创业圈子中拥有极高的地位,被许多人视为获取高质量科技资讯和进行深度讨论的圣地。

03 如何像 Karpathy 一样获取信息?

① 下载 OPML 文件

首先需要打开上面的链接,将 OPML 文件下载到本地。

AI大神Andrej Karpathy开源92个高质量信息源:从nanoGPT到RSS订阅,打造深度学习知识体系

② 选择一个 RSS 订阅器

你可以选择开源的 RSS 订阅工具,例如 Folo

AI大神Andrej Karpathy开源92个高质量信息源:从nanoGPT到RSS订阅,打造深度学习知识体系

除了 Folo,你也可以使用其他的 RSS 阅读工具,比如 NetNewsWire

AI大神Andrej Karpathy开源92个高质量信息源:从nanoGPT到RSS订阅,打造深度学习知识体系

③ 导入 OPML 文件

在 RSS 阅读器中,导入刚刚下载的 OPML 文件即可。

AI大神Andrej Karpathy开源92个高质量信息源:从nanoGPT到RSS订阅,打造深度学习知识体系
AI大神Andrej Karpathy开源92个高质量信息源:从nanoGPT到RSS订阅,打造深度学习知识体系

导入成功后,你就能看到这些热门的博客列表了。

AI大神Andrej Karpathy开源92个高质量信息源:从nanoGPT到RSS订阅,打造深度学习知识体系

04 这个信息源包含什么?

这份信息源包含了许多高质量的博客,例如:

  • Simon Willison:Django 框架的联合创始人,现在专注于研究如何务实地使用 AI。不同于炒作概念的人,他会手写代码测试各种新模型,并分享详细的 Prompt 工程技巧、API 使用心得以及安全漏洞。

AI大神Andrej Karpathy开源92个高质量信息源:从nanoGPT到RSS订阅,打造深度学习知识体系

  • Neal Agarwal:他不做枯燥的技术分享,而是创作好玩的网页。他的代表作《Stimulation Clicker》(刺激点击器)是对现代互联网多巴胺成瘾的讽刺游戏。他的作品经常霸榜 Hacker News,展示了代码不仅可以用来创造工具,也可以用来创造快乐和艺术。

AI大神Andrej Karpathy开源92个高质量信息源:从nanoGPT到RSS订阅,打造深度学习知识体系

此外,还包括:
* 技术元老:如 Paul Graham(YC 创始人,文章不多但每篇必火)、John Gruber(专注苹果生态评论)。
* 底层技术大佬:如 Julia Evans(用漫画解释 Linux 内核/网络协议)。
* 数学与科学领域:如 Terence Tao(陶哲轩的博客,数学界顶流)。


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/archives/20991

(0)
上一篇 2026年2月10日 下午12:56
下一篇 2026年2月10日 下午2:54

相关推荐

  • 具身智能产业激辩实录:架构革命、数据路径与落地挑战的深度剖析

    2025年被业界普遍视为具身智能的爆发元年,这一领域正经历从概念验证到产业落地的关键转折。在北京鼎好大厦举行的智源具身2025 OpenDay现场,30余家顶尖具身智能企业的创始人、技术负责人齐聚一堂,围绕行业核心议题展开了长达四小时的深度辩论。这场汇聚产学研用各方的对话,不仅揭示了当前行业的技术分歧,更勾勒出未来发展的清晰路径。 在智源研究院院长王仲远的主…

    2025年11月21日
    22500
  • DragonMemory:序列维度压缩技术革新RAG系统,16倍压缩比突破本地部署瓶颈

    在人工智能快速发展的浪潮中,检索增强生成(RAG)系统已成为连接大语言模型与外部知识库的关键桥梁。然而,随着应用场景的复杂化,上下文长度和内存成本问题日益凸显,成为制约RAG系统在资源受限环境中部署的主要障碍。传统解决方案多采用量化、剪枝等技术,但这些方法往往以牺牲语义精度为代价。近期,GitHub上出现的开源项目DragonMemory,以其创新的序列维度…

    2025年11月25日
    22800
  • 阿里千问APP深度解析:Qwen模型全面赋能,开启中国版ChatGPT的超级入口之战

    近日,阿里巴巴集团正式推出面向全球用户的ChatBot应用——千问APP,标志着其在C端AI应用市场的战略布局进入实质性阶段。这一举措不仅是对年初3800亿元AI基础设施投入的延续,更被视为阿里在“AI时代的未来之战”中的关键落子。从产品定位、模型能力到用户体验,千问APP展现出对标ChatGPT的雄心,并凭借其背后的Qwen大模型矩阵,试图在中文语境下打造…

    2025年11月17日
    31400
  • 无界动力获5亿天使融资:具身智能赛道迎来技术-产业双栖领军者

    近日,具身智能领域迎来重磅融资消息——新创公司无界动力宣布完成累计超5亿元的天使轮融资,由红杉中国、线性资本领投,高瓴创投、地平线、华业天成等多家顶级机构跟投。这一融资事件不仅刷新了该赛道早期融资纪录,更因其创始人张玉峰独特的产业背景与团队配置,引发了业界对具身智能商业化路径的深度思考。 从技术演进视角看,具身智能正从实验室概念迈向产业化临界点。无界动力提出…

    2025年11月10日
    19200
  • 百度 ERNIE-5.0(文心5.0) 体验测试(附完整prompt)

    百度近期正式发布了原生全模态大模型ERNIE-5.0(文心5.0)。该模型参数规模达2.4万亿,采用原生全模态统一建模技术,支持文本、图像、音频、视频等多种信息的输入与输出。 核心结论: 三大亮点 中文语境理解能力较强:对双关语、甄嬛体等风格化内容把握到位。 视觉推理能力可用:在六面体展开图等空间能力测试中表现惊喜,图片计数等场景表现良好。 创意写作完成度高…

    2026年2月5日
    43200