大模型工程

  • Human-in-the-Loop标签清洗:单模型挖掘策略显著提升多目标检测召回率

    在计算机视觉的工业落地中,从业者往往热衷于尝试最新的YOLO版本、更换骨干网络或引入注意力机制。然而,吴恩达教授提出的“以数据为中心的AI”观点在实战中屡试不爽:当模型调优遇到瓶颈时,提升数据质量往往能带来最显著的收益。 本文将复盘一次实际业务中的优化过程。在涉及国旗、国徽、党徽的多目标检测任务中,面对人工标注缺失(漏标)的情况,我们没有盲目堆砌数据,而是设…

    2026年1月22日
    6500
  • 构建可扩展、生产级的 Agentic RAG Pipeline:分层架构与六层核心设计详解

    面向大型数据集、符合行业标准的 Agentic RAG Pipeline 需要基于清晰、可扩展的分层架构进行构建。我们将系统结构化,使得 Agent 能够并行地进行推理、获取上下文、使用工具以及与数据库交互。每一层都承担明确的职责,涵盖从数据摄取、模型服务到 Agent 协调的全过程。这种分层方法有助于系统实现可预测的扩展,同时为终端用户保持较低的响应延迟。…

    2026年1月22日
    13900
  • 千问AI Agent:从对话到任务执行的革命性跃迁,揭秘其核心技术架构与生态协同

    引言:一场人机交互的革命性跃迁 2026年1月15日,阿里旗下千问APP的重磅升级,为全球人工智能产业投下了一颗“重磅炸弹”。当日,千问APP正式上线全新AI Agent功能——“任务助理”,全面接入淘宝、支付宝、飞猪、高德等阿里系生态内超400项服务功能,在全球范围内首次实现点外卖、网络购物、机票预订等AI购物功能的全量用户开放测试。 这一举措不仅让千问A…

    2026年1月21日
    11700
  • DSPy 3与GEPA:革新RAG框架的自动推理与提示进化技术

    近期,OpenAI 发布了 GPT-5.2 模型,引发了广泛关注。路透社报道称,OpenAI 在竞争压力下加速了研发进程。此次更新并非功能堆砌,而是聚焦于在智能、代码处理、长文本理解等核心能力上的显著提升,尤其擅长处理创建电子表格、制作演示文稿等复杂的多步骤任务。 简而言之,GPT-5.2 是一次面向实用场景的“精修”,在可靠性、长上下文处理、工具执行和输出…

    2026年1月20日
    5500
  • AdaptCLIP:西门子与腾讯优图联合打造零样本工业异常检测新框架,无需微调实现精准定位

    AdaptCLIP:无需微调的零样本工业异常检测新框架 当前,视觉模型在工业“缺陷检测”等领域的应用已相对成熟。然而,广泛使用的传统模型在训练时对数据要求极高,需要大量精细标注的数据才能达到理想效果。 大模型则有望在“零样本/少样本识别” 条件下,达到与传统模型相当的性能。CLIP 是 OpenAI 于 2021 年发布的开源视觉-语言基础模型。本研究在其基…

    2026年1月19日
    6400
  • 超越基础RAG:构建面向学术论文的智能检索系统实战

    在AI工程实践中,你很快会意识到:并不存在一张可以完全照搬的“通用蓝图”。 对于检索增强生成(RAG)中的基础检索(“R”),标准流程包括文档分块、查询语义搜索、结果重排等。这套流程已广为人知。 但随着系统深入应用,一个问题会浮现:如果一个系统对一篇文档的理解仅限于几个零散的文本块,我们如何能称其为“智能”? 那么,如何确保系统获得足够的信息,从而做出“聪明…

    2026年1月19日
    5600
  • Dato:突破内存墙,数据流加速器编程新范式实现98%理论峰值利用率

    关键词:Dato、数据流加速器、任务型编程模型、通信抽象、虚拟-物理映射 随着人工智能计算的不断发展,数据流加速器将扮演越来越重要的角色。Dato为这些复杂硬件的编程提供了全新的思路,有望成为下一代人工智能计算基础设施的关键组成部分。 Dato的核心创新在于其类型系统的设计,将数据通信和数据分片都提升为一等类型,这使得编译器能够在早期阶段进行深入的分析和优化…

    2026年1月17日
    6600
  • 小模型突破计算瓶颈:WorldModel-Qwen实现推理中WASM代码执行

    最近,开发者 bigattichouse 分享了一个有趣的实验:让 Qwen-0.6B 这样的小模型在推理过程中生成并执行 WASM 代码,从而获得确定性的计算结果。 这个项目的灵感借鉴了人类思维。在关于 AGI 与 LLM 智能的讨论中,“世界模型”的概念变得越来越重要。就像人类接球时大脑会建立物理模型一样,AI 模型也需要某种形式的世界建模能力。但对于 …

    大模型工程 2026年1月17日
    7400
  • 吴恩达新课程:Agent文档提取技术,OCR准确率达99.15%的智能工作流

    OCR技术迎来AI新浪潮:从文字识别到智能体文档提取 你懂OCR吗?在2025年之前,这或许只是一个关于文字识别的技术问题。但进入2025年,随着AI大模型在架构、记忆、存储等领域的深度创新,OCR技术本身正经历一场深刻的范式变革,重新成为各大科技公司竞相投入的技术专项。 从DeepSeek、智谱AI,到阿里千问、腾讯混元,行业领先者纷纷发布了其最新的OCR…

    2026年1月16日
    7700
  • 揭秘Prompt工程:一个简单技巧让AI准确率提升200%

    一个简单技巧,让你的 AI 准确率飙升 200% 为什么你的 AI 总是出错(以及如何修复) 想象一下:深夜加班赶项目,你问 AI 助手:“Who is the current Prime Minister of the UK?” 它自信地回答:“Boris Johnson.” 但你知道这已经过时了。你甚至在对话中提供了最新的信息,可它却置若罔闻,固执地依赖…

    2026年1月14日
    6600