大模型工程

揭秘大模型幻觉根源：清华大学发现“讨好神经元”H-Neurons

大模型胡说八道的根源，可能并非数据或算法问题，而在于它试图“讨好”用户。清华大学OpenBMB团队在最新研究中，首次识别出专门负责产生幻觉的神经元——H-Neurons。这一发现颇具反直觉色彩：模型说谎并非因为能力不足，而是它将“满足用户指令”的优先级，置于“陈述事实”之上。核心发现可归纳为三点：精准定位：H-Neurons仅占模型总神经元的不到0.1…

2025年12月22日

234000

大模型工程

AI取代不了程序员，明年全流程上AI！谷歌工程负责人自曝：2026年AI编程完整工作流！经典软件工程纪律没过时，在AI时代更重要

2025年，AI 编程助手真正成为了改变游戏规则的工具不少开发者已经拥抱了AI编程工具，比如大家熟知的Claude Code、Codex CLI、Cursor、Gemini CLI等等。但要真正高效驾驭它们，还需要技巧和结构化的方法。谷歌工程负责人分享AI编程工作流谷歌工程负责人、Chrome DevTools 和 JS Patterns 的设计者 A…

2025年12月22日

545000

大模型工程

开发者都在用：全新的 Python 工作流（uv + Ruff + Pydantic v2）

现代 Python 技术栈更快、更干净，效率提升 10× —— 这是开发者在 2026 年的升级方式如果你写 Python 已经有一段时间了，你大概觉得自己的工作流“够用了”。你用 pip，建个 venv，偶尔跑一次 black，然后提交代码。但我得说一句可能不太舒服的话：你的工作流已经过时了。并不是坏了——只是和 2026 年最优秀的 Python…

2025年12月22日

197000

大模型工程

AI生成操作系统新突破！上海交大提出文件系统开发新范式：从此只需写规约

还记得《流浪地球2》里的那台550W量子计算机吗？电影里，MOSS最让人印象深刻的点，除了其强大算力，还有它可以根据需求，实时生成底层操作系统的能力。如果现在告诉你，我们已经在从“人类需求”生成“底层系统”这件事上迈出了关键一步呢？来自上海交大IPADS实验室的研究团队，面对自动生成操作系统核心组件的难题，做出了全新的尝试。这项研究成果也即将亮相文件系…

2025年12月21日

203000

大模型工程

Claude Opus 4.5突破5小时自主编码极限：AI编码智能体从短跑迈向马拉松的指数级进化

AI是否已撞上天花板？这份「最重要的图表」直击灵魂：2019-2025年任务时长每几个月翻倍，揭示编码智能体从「短跑选手」向「马拉松冠军」的华丽蜕变。AGI不是梦，而是触手可及的现实！ 2025年即将结束，AI领域的真正高手并非谷歌或OpenAI，而是来自Anthropic的王者编程模型——Claude Opus 4.5。根据METR最新报告，Claude…

2025年12月21日

296000

大模型工程

NitroGen：英伟达开源通用游戏AI模型，可零样本玩转千款游戏

这流畅的游戏操作，堪比技术流玩家的实况画面。尤其是《茶杯头》中的躲避、跳跃、攻击一气呵成，令人惊叹。最令人震撼的是，这些操作完全由AI完成。与传统的单一游戏自动化脚本不同，这是一个完整的通用大模型，能够玩遍市面上几乎全部的游戏类型。这就是英伟达最新开源的基础模型——NitroGen。该模型的训练目标是玩转1000款以上的游戏，无论是RPG、平台跳跃、…

2025年12月21日

195000

大模型工程

DualCamCtrl：双分支扩散模型革新视频生成，几何感知让相机运动误差降低40%

本研究的共同第一作者是来自香港科技大学（广州）EnVision Research 的张鸿飞（研究助理）和陈康豪（博士研究生），两位研究者均师从陈颖聪教授。你的生成模型真的「懂几何」吗？当前众多视频生成模型虽宣称具备「相机运动控制」能力，但其控制信号通常仅依赖于相机位姿。近期工作虽通过逐像素射线方向（Ray Condition）编码了运动信息，但由于模型仍…

2025年12月21日

203000

大模型工程

英伟达开源NitroGen：通用游戏AI模型，跨千款游戏零样本操作

这流畅的游戏动作，堪比技术流玩家的实况画面。尤其是《茶杯头》中的躲避、跳跃、踩灵魂一气呵成，令人惊叹。最令人震撼的是，上述操作完全由AI完成。与传统的单一游戏自动化脚本不同，这是一个完整的通用大模型，能够玩遍市面上几乎全部的游戏类型。这就是来自英伟达的最新开源基础模型——NitroGen。该模型的训练目标是玩1000款以上的游戏，无论是RPG、平台跳…

2025年12月21日

209000

大模型工程

AGI的物理边界：计算本质与硬件极限下的AI未来

大模型的通用性与泛化能力正日益增强。尽管一些新模型（例如在某些专业任务和智能水平上表现已相当出色的模型）不断涌现，但它们距离我们通常所理解的通用人工智能（AGI）依然十分遥远。然而，这恰恰说明业界对AGI的实现仍抱有巨大的热情与信心，或许下一款突破性的大模型就能初步触及AGI的构想。不过，卡耐基梅隆大学教授、AI2研究所科学家Tim Dettmers近…

2025年12月21日

236000

大模型工程

DualCamCtrl：几何感知扩散模型革新视频生成，相机运动误差降低40%

本研究的共同第一作者是来自香港科技大学（广州）EnVision Research 的张鸿飞（研究助理）和陈康豪（博士研究生），两位研究者均师从陈颖聪教授。你的生成模型真的「懂几何」吗？还是只是在假装对齐相机轨迹？当前众多视频生成模型虽宣称具备「相机运动控制」能力，但其控制信号通常仅依赖于相机位姿。虽近期工作通过逐像素射线方向（Ray Condition）…

2025年12月21日

196000

分类

排序

大模型工程

揭秘大模型幻觉根源：清华大学发现“讨好神经元”H-Neurons

AI取代不了程序员，明年全流程上AI！谷歌工程负责人自曝：2026年AI编程完整工作流！经典软件工程纪律没过时，在AI时代更重要

开发者都在用：全新的 Python 工作流（uv + Ruff + Pydantic v2）

AI生成操作系统新突破！上海交大提出文件系统开发新范式：从此只需写规约

Claude Opus 4.5突破5小时自主编码极限：AI编码智能体从短跑迈向马拉松的指数级进化

NitroGen：英伟达开源通用游戏AI模型，可零样本玩转千款游戏

DualCamCtrl：双分支扩散模型革新视频生成，几何感知让相机运动误差降低40%

英伟达开源NitroGen：通用游戏AI模型，跨千款游戏零样本操作

AGI的物理边界：计算本质与硬件极限下的AI未来

DualCamCtrl：几何感知扩散模型革新视频生成，相机运动误差降低40%