预训练 - 鲸林向海

突破语言桎梏：用神经细胞自动机预训练大模型，性能提升6%，推理能力增强

如果有一天，大语言模型不再依赖人类语言进行训练，会发生什么？近年来，大模型能力的飞跃几乎都建立在一个前提之上：海量的文本数据。然而，随着高质量文本资源逐渐逼近极限，研究者开始提出一个更根本的问题：语言，真的是智能的起点吗？一项最新研究给出了一个出人意料的答案：或许不是。研究团队假设，让语言模型在学习语言之前，先在完全非语言的合成数据上进行“预预训练”（p…

2026年3月14日

141000

大模型训练

ReVision突破：无需图文配对，几何对齐解锁多模态大模型预训练新范式

无需图文配对，几何对齐解锁多模态大模型预训练新范式在多模态大模型（MLLM）的研发中，一个长期共识是：没有图文对（Image-Text Pairs），就没有多模态能力。为了训练模型理解图像，业界通常需要耗费巨资收集海量图片，并为每张图片生成高质量的文本描述。这种强监督的配对数据，一直被视为多模态训练的基石。然而，来自港科大（广州）、新加坡国立大学等机构的…

2026年3月3日

105000

大模型训练

Gemini3预训练负责人揭秘：从无限数据到数据受限，AI研究正演变为复杂系统工程

Gemini 3的逆袭，给业界带来了太多的惊喜和问号。与此前不同的是，业界到现在似乎也没有逆向出Gemini3的秘方出来。本周五，继谷歌两位大佬 Demis、Jeff Dean 播客访谈之后，终于有一位一线的负责人出来爆料了。这位可没有前面两位大佬嘴严。 Google DeepMind 的 Gemini 3 预训练负责人 Sebastian Bourjo…

2025年12月21日

373010