AI研究
-
一张图看懂主流大模型架构!AI研究者整理「LLM Architecture Gallery」在线图谱
近年来,大模型领域发展迅速,新模型层出不穷。从 GPT、Llama、Gemma、Mistral,到 DeepSeek、Qwen、Kimi、GLM、MiniMax 等,几乎每周都有新架构发布。 然而,随着架构创新日益增多,理解它们却变得愈发困难。不同论文中的模型结构图风格各异,模块命名也不统一,即便是研究者,也很难快速把握一个模型的关键改动之处。 纵观过去几年…
-
UniScientist:30B参数开源模型实现科研闭环,匹敌百亿级闭源模型
多数大模型能够生成“看起来像”学术研究的文本,但极少能真正执行研究过程——即提出假设、收集证据、执行可复现的推导,并通过迭代验证形成可靠结论。 近期,发布了BabyVision评测基准(该基准已被多个重要模型采纳)的UniPat AI,在其最新博客《UniScientist: Advancing Universal Scientific Research I…
-
Flapping Airplanes:用“小数据”挑战AI范式,1.8亿美元融资背后的强智能革命
你想象中真正的 AI 是什么样子的? 至少有一点,大多数人会同意:未来的 AI,应该具备像人一样思考的能力。 问题在于,我们现在研究大模型走的这条路,能通向真正的「思考」吗? 当前最先进的大模型系统,几乎是在整个人类可获取的历史数据之上训练出来的:网页、书籍、代码、论文、对话,数万亿 token。训练大模型所需的数据,远超任何一个人类个体一生所能接触的总和。…
-
OpenAI研究员揭秘:无博士学位如何通过公开研究进入顶尖AI实验室
如果没有博士学位,是否就与前沿AI研究无缘? 至少在Noam Brown看来,答案是否定的。 这位OpenAI研究员、o1模型的核心贡献者,近期分享了一系列“非典型研究员”的职业路径。 他们中,有人没有发表过论文,有人未曾攻读研究生,有人白天在麦肯锡工作,晚上在GitHub上推进研究项目。 也有人习惯于在推特上分享见解,或在开源社区积极提问。 这些人的共同去…
-
清华姚班天才陈立杰全职加盟OpenAI,保留伯克利教职,理论计算机科学迎来新星
清华大学「姚班」校友、加州大学伯克利分校(UC Berkeley)助理教授陈立杰(Lijie Chen)已正式加入 OpenAI。 知情人士透露,陈立杰此次是以全职身份加入 OpenAI 开展研究工作。与此同时,他目前在伯克利的状态为 On Leave(停薪留职),即他保留了在大学的教职,并未离职。 陈立杰是理论计算机科学领域的顶尖青年学者,本科毕业于清华姚…
