大模型工程

  • 从AI聊天到代理小队:如何用SCCR框架替代50%编码时间

    AI 生成的图片(概念与提示由作者撰写) 某个深夜,我几乎要关闭代码编辑器,开始质疑自己是否还属于这个行业。 我遵循了所有“正确”的实践:多年的经验、整洁的提交记录、扎实的代码评审。然而,我却目睹着更年轻的开发者以快我一倍的速度交付功能。原因在于,他们天生采用了一种“AI优先”的工作方式,而我仍将AI视为一个更聪明的搜索框。 他们在与“代理”结对编程。我却在…

    2025年11月20日
    7900
  • 构建可自我进化的Agentic RAG系统:从医疗健康领域实践到通用设计模式

    Agentic RAG 系统可以被视为一个高维度的决策空间,其中每个维度都对应一项关键设计选择,例如提示工程、智能体协同机制或检索策略。手动调整这些维度以找到最优组合不仅极其困难,而且系统上线后遇到的未知数据也常常会打破在测试环境中有效的配置。 因此,一个更优的解决方案是让系统具备“自我优化”的能力。一条典型的、可自我进化的 Agentic RAG 流水线遵…

    2025年11月19日
    7400
  • OpenMemory:开源AI长期记忆系统,为聊天机器人装上“人工大脑”

    大多数AI助手在对话结束后便会遗忘一切,它们无法记住你的姓名、偏好,甚至是前一天刚刚提及的细节。 这正是OpenMemory引人注目的原因。作为一个开源、可本地部署的系统,它为AI赋予了真正的长期记忆能力,相当于为你的聊天机器人或Copilot安装了一个“人工大脑”。 OpenMemory 是什么? 你可以将其视为AI的智能“备忘录”。它不仅仅是存储文本片段…

    2025年11月14日
    7500
  • 如何使用 Knowledge Graph 和 LLM 构建构建问答系统

    基于模拟 FAQ 文档构建的知识图谱 本文将介绍一个基于知识图谱(使用上一篇文章介绍的方法构建)和大型语言模型(LLM,此处使用 Gemma3-4b-it-qat)的简易问答系统。选择 Gemma3-4b 是因为其模型尺寸适中,可在普通笔记本电脑上运行,且具备出色的指令遵循能力。 我们将以一个虚构智能手机产品的 FAQ 文本为例,复用上一篇文章的代码为其构建…

    2025年11月13日
    7700
  • Context Window终极掌控指南:如何避免AI编码代理的“健忘症”与性能下滑

    Context Window 终极掌控指南 关于AI编码代理(coding agents)的讨论往往两极分化。一方认为“AI编码糟透了,我试过,没用”,另一方则反驳“不,是你用错了,这是技能问题”。 双方都有一定道理。但对于大多数开发者而言,在使用AI编码代理时最容易“翻车”的技能问题,往往源于对Context Window的理解不足——这是决定编码代理如何…

    2025年11月11日
    8600
  • 别再把 AI 当“自动补全”了:代码智能体真正的用法被忽视了

    写出更简洁、更聪明的 Python 函数 许多开发者,包括经验丰富的老手,在编写 Python 函数时都会不自觉地陷入一些常见陷阱。这些做法短期内或许不会引发问题,但随着代码库的增长,它们会导致代码变得难以维护、效率低下。 如果你对 Python 函数的理解还停留在“能跑就行”,现在是时候升级你的认知了。了解这些常见误区并采用最佳实践,能让你的代码焕然一新。…

    2025年11月10日
    8700
  • 终结 Prompt?斯坦福论文揭示大模型下一阶段的新范式

    Verbalized Sampling 示意图 / By Author 提示词工程即将迎来变革?一篇曾被忽略的斯坦福论文(https://arxiv.org/pdf/2510.01171)揭示了这一可能。其核心思想与一篇Medium文章(https://medium.com/generative-ai/stanford-just-killed-prompt-…

    2025年11月8日
    7700
  • 上下文工程:AI长任务性能优化的核心策略

    Prompts 确立意图。Context 选择事实、历史和工具输出,让 AI 在长任务中保持连贯。 在 AI 应用的早期,我们沉迷于字词的斟酌。微调一个动词,增加一条约束,观察模型是否按预期响应。这些技巧常常奏效,足以让人以为这是一门手艺。直到任务变得更长、更复杂、涉及更多步骤时,一条安静的真相才浮出水面:措辞固然重要,但模型看到什么 更为关键。 Promp…

    2025年11月7日
    8400
  • 自进化Text-to-SQL系统:基于Stanford ACE框架的智能查询优化革命

    自进化Text-to-SQL系统:基于Stanford ACE框架的智能查询优化革命 当前,大多数Text-to-SQL系统采用多智能体架构与单体式提示词。它们通过一系列分工明确的智能体(如负责模式分析、查询规划和SQL生成的智能体)来协作生成可执行的SQL查询。 尽管这些单体式系统能够工作,将“显示顶级客户”这样的自然语言转换为SQL,但其生成的查询结果往…

    2025年11月6日
    7700
  • 构建智能数据库对话助手:基于RAG的Text-to-SQL聊天机器人实战

    本项目构建了一个由 AI 驱动的聊天机器人,能够将自然语言问题转换为 SQL 查询,并直接从 SQLite 数据库中检索答案。该应用结合了 LangChain、Hugging Face Embeddings 和 Chroma 向量存储,通过检索增强生成(RAG)工作流,将非结构化的用户输入与结构化数据库连接起来,并配备了 FastAPI 后端与 Stream…

    2025年11月4日
    9200