AI研究 - 鲸林向海

开源项目

一张图看懂主流大模型架构！AI研究者整理「LLM Architecture Gallery」在线图谱

近年来，大模型领域发展迅速，新模型层出不穷。从 GPT、Llama、Gemma、Mistral，到 DeepSeek、Qwen、Kimi、GLM、MiniMax 等，几乎每周都有新架构发布。然而，随着架构创新日益增多，理解它们却变得愈发困难。不同论文中的模型结构图风格各异，模块命名也不统一，即便是研究者，也很难快速把握一个模型的关键改动之处。纵观过去几年…

2026年3月16日

789000

开源项目

UniScientist：30B参数开源模型实现科研闭环，匹敌百亿级闭源模型

多数大模型能够生成“看起来像”学术研究的文本，但极少能真正执行研究过程——即提出假设、收集证据、执行可复现的推导，并通过迭代验证形成可靠结论。近期，发布了BabyVision评测基准（该基准已被多个重要模型采纳）的UniPat AI，在其最新博客《UniScientist: Advancing Universal Scientific Research I…

2026年3月9日

431000

AI产业动态

Flapping Airplanes：用“小数据”挑战AI范式，1.8亿美元融资背后的强智能革命

你想象中真正的 AI 是什么样子的？至少有一点，大多数人会同意：未来的 AI，应该具备像人一样思考的能力。问题在于，我们现在研究大模型走的这条路，能通向真正的「思考」吗？当前最先进的大模型系统，几乎是在整个人类可获取的历史数据之上训练出来的：网页、书籍、代码、论文、对话，数万亿 token。训练大模型所需的数据，远超任何一个人类个体一生所能接触的总和。…

2026年1月29日

322000

AI产业动态

OpenAI研究员揭秘：无博士学位如何通过公开研究进入顶尖AI实验室

如果没有博士学位，是否就与前沿AI研究无缘？至少在Noam Brown看来，答案是否定的。这位OpenAI研究员、o1模型的核心贡献者，近期分享了一系列“非典型研究员”的职业路径。他们中，有人没有发表过论文，有人未曾攻读研究生，有人白天在麦肯锡工作，晚上在GitHub上推进研究项目。也有人习惯于在推特上分享见解，或在开源社区积极提问。这些人的共同去…

2026年1月25日

374000

AI产业动态

清华姚班天才陈立杰全职加盟OpenAI，保留伯克利教职，理论计算机科学迎来新星

清华大学「姚班」校友、加州大学伯克利分校（UC Berkeley）助理教授陈立杰（Lijie Chen）已正式加入 OpenAI。知情人士透露，陈立杰此次是以全职身份加入 OpenAI 开展研究工作。与此同时，他目前在伯克利的状态为 On Leave（停薪留职），即他保留了在大学的教职，并未离职。陈立杰是理论计算机科学领域的顶尖青年学者，本科毕业于清华姚…

2026年1月15日

535000