大模型工程

上下文工程：AI长任务性能优化的核心策略

Prompts 确立意图。Context 选择事实、历史和工具输出，让 AI 在长任务中保持连贯。在 AI 应用的早期，我们沉迷于字词的斟酌。微调一个动词，增加一条约束，观察模型是否按预期响应。这些技巧常常奏效，足以让人以为这是一门手艺。直到任务变得更长、更复杂、涉及更多步骤时，一条安静的真相才浮出水面：措辞固然重要，但模型看到什么更为关键。 Promp…

2025年11月7日

202000

大模型工程

自进化Text-to-SQL系统：基于Stanford ACE框架的智能查询优化革命

自进化Text-to-SQL系统：基于Stanford ACE框架的智能查询优化革命当前，大多数Text-to-SQL系统采用多智能体架构与单体式提示词。它们通过一系列分工明确的智能体（如负责模式分析、查询规划和SQL生成的智能体）来协作生成可执行的SQL查询。尽管这些单体式系统能够工作，将“显示顶级客户”这样的自然语言转换为SQL，但其生成的查询结果往…

2025年11月6日

196000

大模型工程

构建智能数据库对话助手：基于RAG的Text-to-SQL聊天机器人实战

本项目构建了一个由 AI 驱动的聊天机器人，能够将自然语言问题转换为 SQL 查询，并直接从 SQLite 数据库中检索答案。该应用结合了 LangChain、Hugging Face Embeddings 和 Chroma 向量存储，通过检索增强生成（RAG）工作流，将非结构化的用户输入与结构化数据库连接起来，并配备了 FastAPI 后端与 Stream…

2025年11月4日

223000

大模型工程

2025 年最火的 5 大 MCP 服务器，打造极致「Vibe Coding」体验

如果你还在手动复制项目上下文给AI，或者反复粘贴数据库Schema来让Cursor理解你的项目，那么你正在做太多不必要的重复劳动。最近，我深入体验了一系列新的MCP工具，它们彻底重塑了我利用AI进行项目开发的方式。我们来深入探讨一下原因——为什么这些工具能让AI从一个“看起来不错”的玩具，转变为真正实用的生产力伙伴。什么是MCP？ “MCP”代表模型上下…

2025年11月3日

182000

大模型工程

LangGraph实战：单智能体与多智能体系统的性能对比与架构解析

在 LangGraph 中基于结构化数据源构建在 LangGraph 中构建不同的 agent 系统 | Image by author 对于希望构建不同智能体系统的开发者而言，一个有效的切入点是深入比较单智能体工作流与多智能体工作流，这本质上是评估系统设计的灵活性与可控性之间的权衡。本文旨在阐明 Agentic AI 的核心概念，并演示如何利用 Lan…

2025年11月2日

206000

大模型工程

AI结对编程实战：Claude与Codex协同开发，效率提升10倍的魔法组合

上周，我无意间组建了一支特别的开发团队。这支“团队”由我、Claude Code 和 Codex 组成，我们分坐在屏幕两侧，像两位彼此挑剔但又不得不合作的工程师。说实话，效果堪称神奇。如果你想在不崩溃的情况下将开发速度提升一个数量级，这套组合可能是目前最接近真人结对编程体验的 AI 方案。下面我将展示它的实际工作流程——不夸大，全是实战经验。步骤 1：…

2025年11月1日

196000

大模型工程

DeepSeek OCR：颠覆传统，用视觉压缩破解AI扩展的“十亿美元级”文档处理难题

Part I: 文本的“隐形重量” 我们通常认为文本是“轻”的：易于存储、传输和计算。但在大语言模型时代，文本变得非常“重”。处理一张发票的PDF扫描件，就可能消耗1,000至5,000个tokens。将这个数量级乘以企业日志、法律合同、监管文件和数字化档案，总token量将变得极其庞大——其中大部分是冗余、昂贵且处理缓慢的。虽然OpenAI的GPT-4-…

2025年10月31日

186000

AI产业动态

AI在线强化学习实现“实践式学习”，斯坦福团队助力7B小模型性能大幅提升，表现超越GPT-4o

斯坦福团队推出AgentFlow框架，通过在线强化学习让仅7B参数的小模型在流式协作中“边做边学”。该方法使模型在搜索、数学等10项任务中性能显著提升，部分表现甚至超越了GPT-4o等超大模型，证明了优化系统设计可突破模型规模限制。

2025年10月24日

590000

大模型工程

AI Agent部署的95%失败率真相：Uber等大厂600人圆桌揭示上下文工程与权限治理的关键突破

大多数创业者以为自己在构建AI产品，其实他们真正在做的是构建上下文选择系统。近期，旧金山举办了一场高规格AI圆桌讨论，嘉宾包括来自Uber、WisdomAI、EvenUp和Datastrato的工程师和机器学习负责人。这场名为“Beyond the Prompt”的活动吸引了600多位报名者，主要是创始人、工程师和早期AI产品构建者。讨论的核心议题是上下…

2025年10月20日

213000

大模型工程

DeepSeek 本地化部署：打造专属智能助手

本文详细介绍了如何在本地使用Ollama框架部署DeepSeek模型，涵盖硬件要求、安装步骤、界面搭建及注意事项，帮助用户打造安全私密的个人智能助手。

2025年10月15日

352000

分类

排序

大模型工程

上下文工程：AI长任务性能优化的核心策略

自进化Text-to-SQL系统：基于Stanford ACE框架的智能查询优化革命

构建智能数据库对话助手：基于RAG的Text-to-SQL聊天机器人实战

2025 年最火的 5 大 MCP 服务器，打造极致「Vibe Coding」体验

LangGraph实战：单智能体与多智能体系统的性能对比与架构解析

AI结对编程实战：Claude与Codex协同开发，效率提升10倍的魔法组合

DeepSeek OCR：颠覆传统，用视觉压缩破解AI扩展的“十亿美元级”文档处理难题

AI在线强化学习实现“实践式学习”，斯坦福团队助力7B小模型性能大幅提升，表现超越GPT-4o

AI Agent部署的95%失败率真相：Uber等大厂600人圆桌揭示上下文工程与权限治理的关键突破

DeepSeek 本地化部署：打造专属智能助手