大模型工程

AI Agents工具构建指南：从规范定义到高效使用的核心策略

AI Agent 是由一系列大语言模型（LLM）调用构成的程序。它们接收用户任务，并通过调用“工具”来高效解决问题。工具本质上是 Agent 可以调用的函数。然而，构建一个高效的 Agent 远不止于简单地将一组函数塞入其上下文。关键在于如何精心定义工具，以及如何向 Agent 清晰地传达这些工具的信息。本文旨在阐述为 AI Agent 构建工具时应关注的…

2025年11月24日

191000

大模型工程

Gemini 3深度评测：硬核编程的SOTA王者，为何在Web开发上“翻车”？

📌 简短结论：强得离谱，但并非全能综合各类基准测试与我的实际体验，可以得出结论：Gemini 3 是目前我测试过最接近“真实智能”的模型。特别是在硬核编程任务上，其表现超越了包括 GPT-5 Pro 和 Gemini 2.5 Deep Think 在内的所有竞品。 ✅ 当前处于 SOTA（最优）水平的领域：调试复杂的编译器 Bug 无逻辑错误地重构大型代…

2025年11月22日

200000

大模型工程

LangGraph实战：构建高效Agentic工作流，解锁AI应用开发新范式

用 Agentic 框架构建 AI 工作流随着 GPT-5、Gemini 2.5 Pro 等强大 AI 模型的涌现，旨在高效利用这些模型的 Agentic 框架也日益增多。这类框架通过抽象化诸多复杂环节，极大地简化了与 AI 模型的协作，例如处理工具调用、管理智能体状态以及集成人工反馈循环。本文将深入探讨其中一个可用的 Agentic AI 框架：Lan…

2025年11月21日

210000

大模型工程

从AI聊天到代理小队：如何用SCCR框架替代50%编码时间

AI 生成的图片（概念与提示由作者撰写）某个深夜，我几乎要关闭代码编辑器，开始质疑自己是否还属于这个行业。我遵循了所有“正确”的实践：多年的经验、整洁的提交记录、扎实的代码评审。然而，我却目睹着更年轻的开发者以快我一倍的速度交付功能。原因在于，他们天生采用了一种“AI优先”的工作方式，而我仍将AI视为一个更聪明的搜索框。他们在与“代理”结对编程。我却在…

2025年11月20日

180000

大模型工程

构建可自我进化的Agentic RAG系统：从医疗健康领域实践到通用设计模式

Agentic RAG 系统可以被视为一个高维度的决策空间，其中每个维度都对应一项关键设计选择，例如提示工程、智能体协同机制或检索策略。手动调整这些维度以找到最优组合不仅极其困难，而且系统上线后遇到的未知数据也常常会打破在测试环境中有效的配置。因此，一个更优的解决方案是让系统具备“自我优化”的能力。一条典型的、可自我进化的 Agentic RAG 流水线遵…

2025年11月19日

188000

大模型工程

OpenMemory：开源AI长期记忆系统，为聊天机器人装上“人工大脑”

大多数AI助手在对话结束后便会遗忘一切，它们无法记住你的姓名、偏好，甚至是前一天刚刚提及的细节。这正是OpenMemory引人注目的原因。作为一个开源、可本地部署的系统，它为AI赋予了真正的长期记忆能力，相当于为你的聊天机器人或Copilot安装了一个“人工大脑”。 OpenMemory 是什么？你可以将其视为AI的智能“备忘录”。它不仅仅是存储文本片段…

2025年11月14日

189000

大模型工程

如何使用 Knowledge Graph 和 LLM 构建构建问答系统

基于模拟 FAQ 文档构建的知识图谱本文将介绍一个基于知识图谱（使用上一篇文章介绍的方法构建）和大型语言模型（LLM，此处使用 Gemma3-4b-it-qat）的简易问答系统。选择 Gemma3-4b 是因为其模型尺寸适中，可在普通笔记本电脑上运行，且具备出色的指令遵循能力。我们将以一个虚构智能手机产品的 FAQ 文本为例，复用上一篇文章的代码为其构建…

2025年11月13日

168000

大模型工程

Context Window终极掌控指南：如何避免AI编码代理的“健忘症”与性能下滑

Context Window 终极掌控指南关于AI编码代理（coding agents）的讨论往往两极分化。一方认为“AI编码糟透了，我试过，没用”，另一方则反驳“不，是你用错了，这是技能问题”。双方都有一定道理。但对于大多数开发者而言，在使用AI编码代理时最容易“翻车”的技能问题，往往源于对Context Window的理解不足——这是决定编码代理如何…

2025年11月11日

196000

大模型工程

别再把 AI 当“自动补全”了：代码智能体真正的用法被忽视了

写出更简洁、更聪明的 Python 函数许多开发者，包括经验丰富的老手，在编写 Python 函数时都会不自觉地陷入一些常见陷阱。这些做法短期内或许不会引发问题，但随着代码库的增长，它们会导致代码变得难以维护、效率低下。如果你对 Python 函数的理解还停留在“能跑就行”，现在是时候升级你的认知了。了解这些常见误区并采用最佳实践，能让你的代码焕然一新。…

2025年11月10日

242000

大模型工程

终结 Prompt？斯坦福论文揭示大模型下一阶段的新范式

Verbalized Sampling 示意图 / By Author 提示词工程即将迎来变革？一篇曾被忽略的斯坦福论文（https://arxiv.org/pdf/2510.01171）揭示了这一可能。其核心思想与一篇Medium文章（https://medium.com/generative-ai/stanford-just-killed-prompt-…

2025年11月8日

181000

分类

排序

大模型工程

AI Agents工具构建指南：从规范定义到高效使用的核心策略

Gemini 3深度评测：硬核编程的SOTA王者，为何在Web开发上“翻车”？

LangGraph实战：构建高效Agentic工作流，解锁AI应用开发新范式

从AI聊天到代理小队：如何用SCCR框架替代50%编码时间

构建可自我进化的Agentic RAG系统：从医疗健康领域实践到通用设计模式

OpenMemory：开源AI长期记忆系统，为聊天机器人装上“人工大脑”

如何使用 Knowledge Graph 和 LLM 构建构建问答系统

Context Window终极掌控指南：如何避免AI编码代理的“健忘症”与性能下滑

别再把 AI 当“自动补全”了：代码智能体真正的用法被忽视了

终结 Prompt？斯坦福论文揭示大模型下一阶段的新范式