大模型工程
-
LangGraph 2026版:从核心概念到实战,构建自适应AI Agents的完整指南
用 LangGraph 构建 AI Agents(2026 版):保姆级指南 过去两年里,LangGraph 已成为我在 AI 领域构建各类应用的核心工具。无论是聊天机器人、MCP助手、语音机器人还是内部自动化智能体,只要涉及推理、工具调用或多步骤工作流,我几乎都会选择 LangGraph。它反复出现在我的客户项目、个人实验乃至日常的生产系统中。 去年我撰写…
-
DeepSeek开源Engram模块:查算分离破解Transformer/MoE架构记忆推理冲突,开启大模型降本增效新范式
本文将从技术原理、性能验证、算力变革、产业链影响、国际对比及挑战展望六大维度,深度解析这一技术突破的核心价值与行业影响。 2026年1月13日,AI领域迎来一项颠覆性技术突破——DeepSeek在其GitHub官方仓库正式开源了题为《Conditional Memory via Scalable Lookup: A New Axis of Sparsity …
-
OpenAI核心工程师翁家翌深度揭秘:ChatGPT是意外引爆,Infra修Bug速度决定模型公司生死线
“ChatGPT 并不是 OpenAI 精心策划出来的。” “Agent 和 RL 后训练本质上是一回事。” 在发布前,OpenAI 内部甚至做好了“几天后就关掉”的心理准备;最初的目标,只是收集一点真实用户数据。那时没有人预料到,它会在几天内引爆整个世界,更没人能提前画出那条指数级增长的曲线。 而这场“意外爆炸”的背后,其实只是来自一个12人的 “RL T…
-
AscendKernelGen:突破NPU算子生成瓶颈,大语言模型领域适配实现95.5%编译成功率
关键词:昇腾 Ascend、NPU 内核生成、大语言模型、领域适应、强化学习、评估基准 在人工智能飞速发展的今天,深度学习的计算需求呈指数级增长,传统的 CPU 和通用 GPU 已难以满足特定场景下的高效计算要求。为此,神经处理单元(Neural Processing Unit,NPU) 作为专为 AI 计算设计的领域专用加速器,逐渐成为现代 AI 基础设施…
-
突破数据孤岛:Being-H0.5全栈开源具身模型以3.5万小时训练实现跨机器人零样本技能迁移
BeingBeyond团队 投稿 量子位 | 公众号 QbitAI 近年来爆火的具身智能领域长期面对着数据孤立导致的训练困境,一线厂商凭借高投入建立独属于自研型号机器的“数据护城河”,而小厂的资产规模直接反映在数据体量上,限制了其产品专用模型的训练。 BeingBeyond团队 近日发布的Being-H0.5有望改变这一局面。 Being-H0.5是目前训练…
-
UltraRAG 3.0重磅发布:可视化白盒框架,让RAG开发从数月缩短至一周
“验证算法原型只需一周,构建可用系统却耗时数月。” 这句看似调侃的“吐槽”,却是每一位算法工程师不得不面对的真实困境。 今天,清华大学 THUNLP 实验室、东北大学 NEUIR 实验室、OpenBMB 、面壁智能与 AI9Stars 联合发布 UltraRAG 3.0。 针对上述痛点,为科研工作者与开发者打造更懂开发者的技术框架,具备 3 大核心优势: 从…
-
AI颠覆编程:英伟达VibeTensor全栈系统,连论文都100%由AI生成
前两天,Node.js 之父 Ryan Dahl 在 X 上断言:「人类编写代码的时代已经结束了。」该帖引发广泛讨论,浏览量已超过 700 万。现在,一个有力的证明出现了。 近日,英伟达杰出工程师许冰(Bing Xu)在 GitHub 上开源了新项目 VibeTensor,展示了 AI 在编程方面的强大能力。 从名字可以看出,这是「氛围编程」(Vibe Co…
-
4款GitHub开源AI技能:视频剪辑、文本去AI化、小红书发布与技能管理工具
视频剪辑 Skill 这是一个名为 videocut-skills 的开源视频剪辑 Skill,能够辅助完成视频处理工作。它可以自动识别视频中的口误、静音片段以及语气词等冗余内容。通过简单的指令,AI 即可自动处理这些片段,从而显著提高剪辑效率。 该 Skill 集成了多种自动化功能,例如使用 Whisper 模型生成字幕,并支持通过词典进行纠错。它利用 F…
-
澳洲放羊大叔的AI编程革命:5行Bash脚本引爆硅谷,睡觉时AI自动完成5万美元项目
最近,一个名为“Ralph”的AI编程技巧在全球技术社区迅速走红。其核心魔力在于:用户无需手动编写代码,只需设定目标,AI便能在后台自动完成整个开发流程,甚至在你睡觉时完成工作。令人惊讶的是,如此强大的工具,其核心代码仅由5行Bash脚本构成。 在Ralph迅速走红之后,Claude Code官方也推出了一套Ralph Wiggum插件。该插件通过“停止钩子…
-
8个Python库:让机器学习从入门到精通只需一杯咖啡时间
你能在一杯咖啡还没喝完时搭建出你的第一个模型。 先说一句可能听起来有点“逆风”的话: 机器学习并不难。难的是在不必要的复杂性里摸爬滚打。 多数人被机器学习劝退,不是因为不够聪明,而是因为在他们还没开始训练模型前,整个生态就已经把微积分、矩阵符号和数千页的文档砸过来了。 在用 Python 写代码 4 年多、并教过不少开发者(包括非常资深的)之后,我得出一个结…