01 谷歌开源的文档信息抽取神器
谷歌开源了一个名为 LangExtract 的 Python 库,该项目已获得近 3 万 Star。它专门利用大语言模型从非结构化文本中提取结构化信息,例如从临床病历、报告等文档中自动识别和整理关键数据,并能精准定位每条信息在原文中的位置。

其核心特点包括:精确的源定位、针对长文档的优化、以及支持交互式可视化。它能生成独立的 HTML 文件,方便用户在原始上下文中查看和审核成千上万的提取结果。

该库支持灵活的模型选择,从云端的 Gemini 到本地的 Ollama 均可使用。安装方式非常简单:pip install langextract。
- 开源地址:https://github.com/google/langextract
02 GitHub 官方的 AI 工作流框架
GitHub 推出了名为 Agentic Workflows 的项目,允许用户使用自然语言编写 Markdown 来定义和运行 AI 工作流。其核心是:在 Markdown 文件中描述任务,然后通过 GitHub Actions 自动执行。

该项目在安全方面考虑周全,默认采用只读权限,写操作必须通过 safe-outputs 机制完成。它还集成了沙箱执行、输入净化、网络隔离、SHA 固定依赖和工具白名单等多层保护机制。对于希望利用 AI 自动化仓库任务但又担心安全问题的开发者,这是一个值得关注的选择。

- 开源地址:https://github.com/github/gh-aw
03 AI Agent 工具包
pi-mono 是一个 AI Agent 工具包,其亮点之一是 coding agent CLI 可以在树莓派或本地服务器上运行。

该项目包含多个组件:统一的 LLM API、TUI 和 Web UI 库、Slack 机器人、vLLM pods 等。它支持多种模型提供商,包括 Claude、ChatGPT、GitHub Copilot 和 Google Gemini CLI。
在上下文管理方面,它支持自动压缩和恢复,并能在接近上下文长度限制时主动处理,有效避免上下文溢出的问题。

- 开源地址:https://github.com/badlogic/pi-mono
04 100 多个 LLM 应用案例合集
awesome-llm-apps 是一个收集了 100 多个大语言模型应用案例的仓库,涵盖了 RAG、AI Agent、多智能体团队、MCP、语音 Agent 等多种应用模式。

其支持的模型非常全面,包括 OpenAI、Anthropic、Gemini、xAI 以及 Qwen、Llama 等开源模型。仓库中的项目分类细致,从入门级 AI Agent 到高级自主游戏 Agent,从 RAG 应用到带记忆的 LLM 应用,应有尽有。
该项目非常适合希望学习 LLM 应用开发的开发者,每个项目都配有详细文档,可以直接克隆并运行。

- 开源地址:https://github.com/Shubhamsaboo/awesome-llm-apps
05 让 AI 控制 Chrome 浏览器
chrome-devtools-mcp 是一个模型上下文协议服务器,它能让你的 AI 编程助手直接控制和检查 Chrome 浏览器。

它支持丰富的工具集,包括点击、拖拽、填充表单、处理对话框、按键、上传文件等输入自动化操作。同时,它还能分析网络请求、截图、检查控制台消息、录制性能追踪、获取性能洞察等。
这相当于为 AI 助手赋予了完整的 Chrome DevTools 能力,非常适用于自动化测试、性能分析和网页调试。该项目支持 Claude Code、Cursor、Copilot、Gemini CLI 等主流 AI 编程工具。
- 开源地址:https://github.com/ChromeDevTools/chrome-devtools-mcp
06 本地知识库搜索引擎
qmd 是由 Shopify CEO Tobi Lutke 开源的一个本地 Markdown 搜索引擎。它结合了 BM25 全文检索、向量语义搜索和 LLM 重排序技术,全程通过 Ollama 在本地运行,无需联网。

其技术亮点包括:查询扩展(利用 LLM 生成查询变体,并加倍原始查询权重)、混合检索(同时使用 FTS5 和向量搜索)、以及 RRF 融合加位置感知混合(根据排名位置调整检索和重排的权重比例)。
此外,它还支持 MCP 模式,可以与 Claude Code 等 AI 工具无缝集成,非常适合应用于 Agent 工作流中。

- 开源地址:https://github.com/tobi/qmd
关注“鲸栖”小程序,掌握最新AI资讯
本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/archives/21872
