大模型工程
-
上下文工程:AI长任务性能优化的核心策略
Prompts 确立意图。Context 选择事实、历史和工具输出,让 AI 在长任务中保持连贯。 在 AI 应用的早期,我们沉迷于字词的斟酌。微调一个动词,增加一条约束,观察模型是否按预期响应。这些技巧常常奏效,足以让人以为这是一门手艺。直到任务变得更长、更复杂、涉及更多步骤时,一条安静的真相才浮出水面:措辞固然重要,但模型看到什么 更为关键。 Promp…
-
自进化Text-to-SQL系统:基于Stanford ACE框架的智能查询优化革命
自进化Text-to-SQL系统:基于Stanford ACE框架的智能查询优化革命 当前,大多数Text-to-SQL系统采用多智能体架构与单体式提示词。它们通过一系列分工明确的智能体(如负责模式分析、查询规划和SQL生成的智能体)来协作生成可执行的SQL查询。 尽管这些单体式系统能够工作,将“显示顶级客户”这样的自然语言转换为SQL,但其生成的查询结果往…
-
构建智能数据库对话助手:基于RAG的Text-to-SQL聊天机器人实战
本项目构建了一个由 AI 驱动的聊天机器人,能够将自然语言问题转换为 SQL 查询,并直接从 SQLite 数据库中检索答案。该应用结合了 LangChain、Hugging Face Embeddings 和 Chroma 向量存储,通过检索增强生成(RAG)工作流,将非结构化的用户输入与结构化数据库连接起来,并配备了 FastAPI 后端与 Stream…
-
2025 年最火的 5 大 MCP 服务器,打造极致「Vibe Coding」体验
如果你还在手动复制项目上下文给AI,或者反复粘贴数据库Schema来让Cursor理解你的项目,那么你正在做太多不必要的重复劳动。 最近,我深入体验了一系列新的MCP工具,它们彻底重塑了我利用AI进行项目开发的方式。我们来深入探讨一下原因——为什么这些工具能让AI从一个“看起来不错”的玩具,转变为真正实用的生产力伙伴。 什么是MCP? “MCP”代表模型上下…
-
LangGraph实战:单智能体与多智能体系统的性能对比与架构解析
在 LangGraph 中基于结构化数据源构建 在 LangGraph 中构建不同的 agent 系统 | Image by author 对于希望构建不同智能体系统的开发者而言,一个有效的切入点是深入比较单智能体工作流与多智能体工作流,这本质上是评估系统设计的灵活性与可控性之间的权衡。 本文旨在阐明 Agentic AI 的核心概念,并演示如何利用 Lan…
-
AI结对编程实战:Claude与Codex协同开发,效率提升10倍的魔法组合
上周,我无意间组建了一支特别的开发团队。这支“团队”由我、Claude Code 和 Codex 组成,我们分坐在屏幕两侧,像两位彼此挑剔但又不得不合作的工程师。 说实话,效果堪称神奇。如果你想在不崩溃的情况下将开发速度提升一个数量级,这套组合可能是目前最接近真人结对编程体验的 AI 方案。 下面我将展示它的实际工作流程——不夸大,全是实战经验。 步骤 1:…
-
DeepSeek OCR:颠覆传统,用视觉压缩破解AI扩展的“十亿美元级”文档处理难题
Part I: 文本的“隐形重量” 我们通常认为文本是“轻”的:易于存储、传输和计算。但在大语言模型时代,文本变得非常“重”。 处理一张发票的PDF扫描件,就可能消耗1,000至5,000个tokens。将这个数量级乘以企业日志、法律合同、监管文件和数字化档案,总token量将变得极其庞大——其中大部分是冗余、昂贵且处理缓慢的。虽然OpenAI的GPT-4-…
-
AI在线强化学习实现“实践式学习”,斯坦福团队助力7B小模型性能大幅提升,表现超越GPT-4o
斯坦福团队推出AgentFlow框架,通过在线强化学习让仅7B参数的小模型在流式协作中“边做边学”。该方法使模型在搜索、数学等10项任务中性能显著提升,部分表现甚至超越了GPT-4o等超大模型,证明了优化系统设计可突破模型规模限制。
-
AI Agent部署的95%失败率真相:Uber等大厂600人圆桌揭示上下文工程与权限治理的关键突破
大多数创业者以为自己在构建AI产品,其实他们真正在做的是构建上下文选择系统。 近期,旧金山举办了一场高规格AI圆桌讨论,嘉宾包括来自Uber、WisdomAI、EvenUp和Datastrato的工程师和机器学习负责人。这场名为“Beyond the Prompt”的活动吸引了600多位报名者,主要是创始人、工程师和早期AI产品构建者。 讨论的核心议题是上下…
-
DeepSeek 本地化部署:打造专属智能助手
本文详细介绍了如何在本地使用Ollama框架部署DeepSeek模型,涵盖硬件要求、安装步骤、界面搭建及注意事项,帮助用户打造安全私密的个人智能助手。
