大模型工程

  • AI攻克CUDA黑魔法!字节清华联手打造CUDA Agent,智能体强化学习实现内核生成性能飞跃

    关键词: CUDA 内核生成、智能体强化学习、性能优化、KernelBench、技能增强环境 在深度学习基础设施的底层,存在着一个被称为“黑魔法”的领域——CUDA 内核开发。当我们在 PyTorch 中写下几行简洁的代码时,很少有人意识到,这些高层操作最终会被编译成成百上千个在 NVIDIA GPU 上执行的底层内核程序。这些内核程序的编写和优化,直接决定…

    2天前
    5300
  • Agentic RAG实战指南:六种模式解析与生产级应用

    用真实生产取舍解释六种 Agentic RAG 模式 大多数 RAG 演示在理想环境下运行良好,但一旦面对真实用户,问题便接踵而至:检索到无关上下文、浪费大量 tokens,却依然无法避免幻觉。问题的根源往往不在于模型或检索算法本身。 而在于传统 RAG 对所有查询都采用千篇一律的处理方式。 Agentic RAG 改变了这一范式。系统不再机械地执行检索,而…

    4天前
    7700
  • Context Engineering:2026年真正重要的6种技术(完整指南)

    Prompt Engineering 已死。Context Engineering 才是当下生产系统的工作方式。 你的 RAG 系统返回了完美的文档片段,你的提示词也打磨得无可挑剔,但大语言模型(LLM)依然在“幻觉”中编造答案。 例如,当你查询最新的退款政策时,系统可能将2018年至2026年的50份文档全部塞入上下文。LLM 看到相互矛盾的政策,陷入混乱…

    5天前
    15700
  • CMU开源首个Agentic Search行为日志数据集:揭秘1400万条搜索请求背后的智能体行为模式

    在大模型驱动的 Agentic Search 日益常态化的背景下,真实环境中智能体“如何发起查询、如何改写问题、是否真正利用了检索信息”一直缺乏系统性的刻画与分析。 卡内基梅隆大学(CMU)的研究团队基于可重复检索平台 DeepResearchGym,从其统一后端半年的真实流量中整理出超过 1400 万条搜索请求,涉及约 400 万个搜索会话。在完成严格的匿…

    2026年2月9日
    4700
  • 从“魔法”到“分析师”:AI Agent工作流如何重塑2026年智能系统

    第一次接触大型语言模型时,许多人感觉它近乎“魔法”。 你输入一个提示,它给出回应。交互到此结束。 对于快速答疑、头脑风暴或生成一段文本,这种“一次性交互”已足够好。问一个问题,得到一个回复,然后继续下一件事。简单、高效、令人满意。 但当我们开始要求 AI 去完成真正的工作时,问题便暴露出来。 让 AI 去分析市场趋势、交叉核对信息来源、综合洞见,并将这些内容…

    2026年2月2日
    5400
  • UltraRAG 3.0重磅发布:可视化白盒框架,让RAG开发从数月缩短至一周

    “验证算法原型只需一周,构建可用系统却耗时数月。” 这句看似调侃的“吐槽”,却是每一位算法工程师不得不面对的真实困境。 今天,清华大学 THUNLP 实验室、东北大学 NEUIR 实验室、OpenBMB 、面壁智能与 AI9Stars 联合发布 UltraRAG 3.0。 针对上述痛点,为科研工作者与开发者打造更懂开发者的技术框架,具备 3 大核心优势: 从…

    AI产业动态 2026年1月23日
    16500
  • 千问AI Agent:从对话到任务执行的革命性跃迁,揭秘其核心技术架构与生态协同

    引言:一场人机交互的革命性跃迁 2026年1月15日,阿里旗下千问APP的重磅升级,为全球人工智能产业投下了一颗“重磅炸弹”。当日,千问APP正式上线全新AI Agent功能——“任务助理”,全面接入淘宝、支付宝、飞猪、高德等阿里系生态内超400项服务功能,在全球范围内首次实现点外卖、网络购物、机票预订等AI购物功能的全量用户开放测试。 这一举措不仅让千问A…

    2026年1月21日
    29200
  • 吴恩达新课程:Agent文档提取技术,OCR准确率达99.15%的智能工作流

    OCR技术迎来AI新浪潮:从文字识别到智能体文档提取 你懂OCR吗?在2025年之前,这或许只是一个关于文字识别的技术问题。但进入2025年,随着AI大模型在架构、记忆、存储等领域的深度创新,OCR技术本身正经历一场深刻的范式变革,重新成为各大科技公司竞相投入的技术专项。 从DeepSeek、智谱AI,到阿里千问、腾讯混元,行业领先者纷纷发布了其最新的OCR…

    2026年1月16日
    19900
  • 劈开教育“不可能三角”:揭秘AI名师如何实现千人千面个性化教学

    教育领域正迎来一个AI应用新物种—— 其讲课节奏、语气与互动,都展现出高度的自然感。 更重要的是,它不仅能“像老师一样讲课”,还能为每一位学员提供一对一的个性化教学。 这位AI导师,出自一家名为“与爱为舞”的AI原生应用企业。自年初上线以来,已累计为百万级用户提供学习陪伴与一对一讲解服务。 教育行业,向来是一个“规模、质量、成本”的不可能三角。 既要实现千人…

    2025年12月30日
    19300
  • A2UI协议:开启AI原生交互新时代,让智能体“说”出动态界面

    Google 最近开源了一个名为 A2UI 的项目,旨在解决一个实际问题:AI 智能体如何安全地生成丰富的用户界面? 传统上,智能体只能返回文本,用户需要通过多轮对话才能完成任务。而 A2UI 允许智能体直接生成表单、按钮、日期选择器等交互式组件,用户只需点击几下即可完成操作。 从固定界面到动态生成的转变 传统的智能体交互主要基于文字聊天——用户提问,AI …

    2025年12月25日
    48000