01 论文配图自动生成:AutoFigure-Edit
写论文最头疼的是什么?画图,尤其是那些流程图、架构图,往往需要耗费大量时间。AutoFigure-Edit 是一个在 GitHub 上开源的学术工具,它入选了 ICLR 2026,旨在解决论文配图难题。

该工具的核心功能是,将论文方法部分的文字描述输入后,能够自动生成专业的、可编辑的 SVG 格式配图。其工作流程如下:首先利用大型语言模型(LLM)根据文本生成草图,接着使用 SAM3 进行图像分割以识别图标区域,然后通过 RMBG-2.0 去除背景,最后将所有元素组装成完整的矢量图。

AutoFigure-Edit 的一大亮点是支持风格迁移功能。用户可以上传一张参考图片,工具会模仿其风格来绘制新图,这对于统一整篇论文的配图风格非常有帮助。项目还内置了一个 Web 界面,生成的图片可以直接在浏览器中通过拖拽方式进行编辑和调整,操作便捷。

开源地址:https://github.com/ResearAI/AutoFigure-Edit
02 零代码网页自动化:WebRPA
提到网页自动化,人们通常会想到编写 Python 爬虫脚本。但对于非编程人员而言,这存在一定门槛。WebRPA 是一个可视化网页自动化工具,用户通过拖拽功能模块即可构建自动化工作流,无需编写任何代码。
该项目内置了多达 260 个功能模块,覆盖网页操作、数据采集、文件处理、媒体转换、AI 对话等多种场景。它自带 Python 3.13 和 Node.js 运行环境,解压即可使用。
其功能非常全面:浏览器自动化基于 Playwright,支持 CSS 选择器和 XPath 等多种定位方式;数据处理支持 JSON、正则表达式和 Excel 读写;媒体处理基于 FFmpeg,能够处理超过 50 种音视频格式转换;AI 能力则支持 OpenAI、智谱、通义千问等多服务商。



特别值得一提的是其触发器系统,支持 Webhook、定时任务、文件监控、热键监听等 10 种触发方式,可以构建出复杂的自动化流程。该项目由一名大一学生开发,其完整度令人印象深刻。
开源地址:https://github.com/pmh1314520/WebRPA
03 Claude Code 效率神器:Trellis
如果你经常使用 Claude Code 等 AI 编程助手,Trellis 是一个值得关注的项目。它是一个专门为 Claude Code、Cursor、Codex 等工具设计的 AI 框架工具箱,核心目标是让 AI 能够持久记忆你的项目规范和最佳实践。

许多用户的痛点是,每次与 AI 对话都需要重新描述代码规范、组件风格和文件结构。Trellis 通过自动注入机制解决了这一问题:用户只需定义一次规范,它便会在每次对话开始时自动加载。
它还支持并行会话功能,可以在不同的工作树中同时运行多个 AI 任务,彼此互不干扰。这对于需要同时开发多个功能的场景尤为有用。

项目结构设计清晰:spec 目录存放规范文档,workspace 目录是个人工作空间,便于团队协作。另一个实用功能是使用 /trellis:record-session 命令记录工作日志,AI 在下次启动时可以自动读取之前的上下文。


与普通的 CLAUDE.md 文件相比,Trellis 的分层架构更加灵活,只会加载与当前任务相关的规范,避免将所有信息一次性塞给 AI。
开源地址:https://github.com/mindfold-ai/Trellis
04 QQ 机器人接入:qqbot
想要将 AI 能力接入 QQ?sliverp 开源的 qqbot 项目可以提供帮助。它是 OpenClaw 框架的一个插件,通过 QQ 开放平台的长连接事件订阅机制,实现对消息和事件的回调处理。
整个配置流程相对清晰:首先需要在 QQ 开放平台注册账号、创建机器人,获取 AppID 和 AppSecret。然后通过命令 openclaw plugins install @sliverp/qqbot@latest 安装插件,配置好凭证即可使用。

项目文档非常详细,从账号注册、实名认证到机器人创建的每一步都有截图说明,对新手友好。

需要注意的是,目前 QQ 开放平台的机器人仅支持私聊,暂不支持群聊。但对于个人使用场景,私聊功能已足够。
开源地址:https://github.com/sliverp/qqbot
05 生产级 AI Agent 框架:CountBot
CountBot 是一个用 21K 行代码实现的生产级 AI Agent 框架,于今年 2 月开源。该项目虽然定位为字数统计工具,但其架构设计通用性强,采用了工具即智能体的理念,为后续扩展 AI 文本分析、写作辅助等功能预留了空间。
技术栈方面,它基于 Flutter 开发,支持 Windows、macOS、Linux 三大桌面平台,并适配了鸿蒙 HarmonyOS 6.0。对于希望学习跨端开发的开发者而言,这是一个不错的参考项目。
作为一个生产级框架,其代码组织、模块划分和错误处理都比较规范,可以作为学习 AI Agent 架构设计的案例。
开源地址:https://github.com/countbot-ai/CountBot
06 OpenClaw 骨架模板:ai-openclaw-skeletons
该项目是 OpenClaw 生态的一部分,提供了 AI Agent 开发的骨架模板。OpenClaw 是一个开源的全能 AI 助手框架,在 GitHub 上拥有超过 16 万 Star,其核心理念是让 AI 能够实际执行任务,而不仅仅是聊天。

ai-openclaw-skeletons 仓库提供了一系列项目模板,可以帮助开发者快速搭建基于 OpenClaw 的 AI 应用。如果你希望在 OpenClaw 生态中进行二次开发,这个骨架项目可以节省大量的初始化工作。
开源地址:https://github.com/1596941391qq/ai-openclaw-skeletons
关注“鲸栖”小程序,掌握最新AI资讯
本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/archives/22759
