大模型工程
-
小模型革命:为什么1B-7B参数模型正在重塑AI工程未来
一套深度实战的 22 篇工程系列:用 1B–7B 模型打造快速、低成本、私密且强大的 AI 系统。 使用 AI 生成的图像 四个月前,我真的觉得小模型是个笑话。 并非没用——只是…有限。适合做演示、做研究挺有意思,但离生产可用还差得远。 在我看来,“真正的 AI 工程”就该用巨型基础模型和一堆 A100。如果你不在烧算力,你算什么在做 AI? 这个信念在一个…
-
打破库依赖与93%峰值效率!Intel提出MLIR驱动的编译器自动生成NanoKernel实现高性能矩阵乘法内核
关键词: MLIR 、Nanokernels 、 Microkernels 、Matmul、Vectorization、Compiler 超微内核(Nanokernel) 指寄存器级别的最小计算单元,专为特定硬件指令集优化,可作为可组合的、目标无关的编译器 IR 到目标特定指令的 kernel。 论文标题:Library Liberation: Compet…
-
MiroThinker v1.5:30B小模型颠覆万亿参数Agent,交互深度成AI新范式
30B的小模型,竟然在重量级Agent基准测试上,超越了万亿参数的Kimi K2T? MiroThinker v1.5的开源,似乎正在悄然改写行业长久以来对参数规模的迷信。这不仅仅是一次模型迭代,其背后以“交互深度”为核心的训练思想,可能正在定义Agent发展的新范式。 L3的影子 过去几年,AI性能的提升主要围绕两个轴心:数据规模与上下文长度。然而到了20…
-
揭秘16层架构:如何构建成本优化、全链路可观测的生产级知识图谱系统Agentic GraphOS
面向企业生产的、成本优化且全链路可观测的 GraphRAG 操作系统 Agentic GraphOS | 生产可用 · 多智能体 · 思维速度级扩展 本文将从零开始,完整介绍如何构建一套可投入生产的知识图谱系统——GraphOS。你将了解如何架构一个多智能体平台,智能地将查询路由到最具性价比的检索策略,在保持研究级准确率的同时实现 30–50% 的成本优化。…
-
Vibe Coding革新AI Infra:文本驱动设计文档破解复杂系统开发难题
Andrej Karpathy 力荐的 Vibe Coding 正成为开发者的新宠。这种“只需聊一聊,AI 就能把功能写出来”的体验,极大地提升了简单任务的开发效率。 然而,当我们将目光转向实际的复杂系统,特别是 AI 基础设施(AI Infra)领域时,Vibe Coding 往往会陷入“水土不服”的困境。 总结下来,主要有三方面问题: 上下文丢失:对话历…
-
Agent Skills:解锁AI Agent从“思考”到“行动”的关键能力层
为什么说它是 Agentic AI 真正“能干活”的关键 导语|为什么你的 Agent “看起来很聪明,却干不了事”? 许多开发者在初次构建 AI Agent 时,常会遇到一个典型困境: 👉 模型本身能力很强,擅长推理与对话,但一旦接入真实业务场景就频频“卡壳” 其根本原因往往不在于模型本身,而在于——未能真正理解并构建起 Agent Skills(智能体技…
-
LingoEDU:结构化预处理新突破,让大模型生成可溯源,DeepSeek准确率飙升51%
LingoEDU:结构化预处理新突破,让大模型生成可溯源,DeepSeek准确率飙升51% 一种名为LingoEDU(简称EDU,即基本话语单元技术)的新方法,能够零成本降低大模型幻觉,让DeepSeek的准确率相对提升51%。 LingoEDU是一个在大模型正式生成前执行的专用「预处理」模型。其核心在于对输入文本进行精准切分,为每一个最小信息单元(EDU)…
-
HarmonyOS架构深度解析:从分布式能力到实战迁移,解锁万物智联开发新范式
2026年1月10日 13:30,“开发者系列沙龙:‘沪’联万物•智见未来——HarmonyOS架构演进与创新开发实战”即将在上海拉开帷幕。 无论你是刚刚接触鸿蒙生态、渴望掌握开发要领的新手,还是已有一定经验、希望深入理解HarmonyOS架构与创新实战的开发者,本次沙龙都将为你搭建一个高质量的学习与交流平台。 在这里,你不仅能直面鸿蒙技术专家,掌握Harm…
-
谷歌Cloud AI负责人14年经验:21条反直觉工程法则,从“规模让bug也有用户”到“创新需要偿还”
Addy Osmani 是谷歌 Cloud AI 的总监,专注于帮助开发者和企业通过 Gemini、Vertex AI 和代理开发套件(ADK)取得成功。他在谷歌拥有14年的工作经验,曾参与 DevTools、Lighthouse 和 Core Web Vitals 的开发,拥有 25 年构建网络技术的行业经验,同时也是《超越Vibe编程》《学习 JavaS…
-
Claude Code创始人Boris Cherny亲授:13条高效AI编程实战秘籍,引爆500万在线围观
2026年新年第三天,Claude Code的创始人兼负责人Boris Cherny进行了一场线上教学,亲自演示了他使用这款AI编程工具的个人工作流。 他表示,自己的配置可能“简单”得令人意外。Claude Code开箱即用的体验已经非常出色,因此他个人并未进行太多自定义设置。 Boris强调,使用Claude Code没有所谓的“标准答案”。该工具在设计之…