01
让你的 MacBook 也能本地运行 DeepSeek V4
作为 Redis 的缔造者,antirez 在开源社区堪称传奇。
最近,他带来了一个新项目——ds4。上线仅仅 4 天,便收获了超过 7000 个 Star。

ds4 是一个专为 DeepSeek V4 Flash 打造的本地推理引擎,采用 C 语言编写,并针对 Apple Metal 进行了深度调优。
简单来说,它让你能在 MacBook 上运行一个拥有 284B 参数的巨型大模型。
该项目最令人称道的创新点在于其 KV 缓存的磁盘持久化方案。
传统观点认为 KV 缓存只能驻留在内存中,但 antirez 偏偏反其道而行之。
他将 KV 缓存视为与磁盘同等重要的“一等公民”,充分利用现代 MacBook 上速度飞快的 SSD,将 KV 缓存写入磁盘,使得下一次会话可以直接复用。
当你在使用 Claude Code 这类编程 Agent 时,它会反复发送长提示词。以往每次都需要重新进行 Prefill 计算,而现在,直接从磁盘恢复上下文即可,速度提升非常显著。

在量化方面,他也下足了功夫。
他采用了 2-bit 不对称量化策略,仅对 MoE 路由专家层进行激进量化,而共享专家层和投影层则保持不变。这种“好钢用在刀刃上”的做法,让配备 128GB 内存的 MacBook 也能顺利运行,并且在编码 Agent 场景下,依然能够可靠地调用工具。
在性能表现上,MacBook Pro M3 Max 128GB 在运行 q2 量化时,长提示词的 Prefill 速度可达 250 tokens/s,生成速度为 21 tokens/s。
而 Mac Studio M3 Ultra 512GB 则更为强劲,长提示词的 Prefill 速度高达 468 tokens/s。

此外,它还同时兼容 OpenAI 和 Anthropic 的 API 格式,像 Claude Code、opencode 这类编程 Agent 可以直接无缝对接。
- 开源地址:https://github.com/antirez/ds4
02
以文件系统的方式操作 Notion
开源项目 Mirage 颇具创意。
它为 AI Agent 构建了一层统一的虚拟文件系统。

它将 Google Drive、Slack、Gmail、Redis、GitHub、Notion、Linear、Trello、Discord、Telegram、MongoDB、SSH 等众多服务,全部挂载到同一个虚拟目录树之下。
Agent 只需使用 ls、cat、grep、cp 这些基础的 Unix 命令,就能跨服务进行操作。
该项目提供了 Python SDK、TypeScript SDK 以及独立的 CLI 工具,可以直接嵌入到 FastAPI、Express 或浏览器应用中。

它还内置了针对 OpenAI Agents SDK、Vercel AI SDK、LangChain、Pydantic AI 等主流框架的适配层。
uv add mirage-ai # Python
npm install @struktoai/mirage-node # TypeScript
上线仅一天,Star 数就突破了 1000,它确实解决了 Agent 访问多后端服务时的核心痛点。
- 开源地址:https://github.com/strukto-ai/mirage
03
91 个中文提示词宝库
这个开源项目收录了 91 个经过实战检验的中文提示词,并按照九大场景进行了分类。
覆盖了 AI 方法、AI 工作、AI 学习、AI 内容、AI 教育、AI 营销、AI 思考等类别,其中内容创作类最多,达到了 49 个。

每个提示词都附带了标准化的元数据,清晰说明了其适用场景和使用方法。
项目内部还包含一套智能元提示词生成系统,它基于 RTF 框架,将需求分析、角色工程、任务架构、格式规范和质量评估串联成一个可复用的流程。

简单来说,这套流程可以帮助你批量生成高质量的提示词。
- 开源地址:https://github.com/yaojingang/yao-open-prompts
04
内容创作者的“作弊器”
将 cheat-on-content 安装到 Claude Code 后,它会通过一个“打分-盲预测-发布-复盘-进化评分公式”的闭环,把你从凭感觉发布内容,转变为可校准的科学实验。

其最精妙之处在于防自欺机制。
发布前,你必须写下不可篡改的预测,并由 Hook 强制执行。在 T+3 天后进行复盘,对比实际数据与你的预测。评分公式会在每次循环中进化,但升级必须经过全量重打以及跨模型独立审核。
该项目总共包含 13 个子 Skill。安装完成后,你可以在 Claude Code 中用自然语言触发,比如“打分这篇”、“启动预测”、“复盘”。

- 开源地址:https://github.com/XBuilderLAB/cheat-on-content
05
LLM 推理引擎新秀
TokenSpeed 是一个专为 Agent 工作负载从零开始设计的 LLM 推理引擎,其目标非常明确:
在 NVIDIA Blackwell 上,同时实现 TensorRT-LLM 级别的性能和 vLLM 级别的易用性。

其背后的团队阵容相当豪华。
主导方是 LightSeek Foundation(一个非营利组织),协作方包括 NVIDIA DevTech、AMD Triton、通义千问推理团队、Together AI 等。它在 NVIDIA Blackwell 上构建了目前最快的 Multi-head Latent Attention 实现之一。

在 Kimi K2.5 的实际测试中,最小延迟场景下,它比 TensorRT-LLM 快了大约 9%;在 100 TPS/User 附近,吞吐量高出约 11%。
更值得一提的是,TokenSpeed 的 MLA 已经被 vLLM 项目所采用,这足以证明其技术实力。NVIDIA AI 官方 Twitter 也转发了该项目,并称其为“专为光速级 Agent 工作负载打造的崭新推理引擎”。
- 开源地址:https://github.com/lightseekorg/tokenspeed
06
32 套 HTML 幻灯片模板库
这个项目是一个专为 AI 编程 Agent 准备的 HTML 幻灯片模板库。
它收录了 32 套精心设计的模板,风格涵盖 Soft Editorial、Retro Windows、Sakura Chroma、8-Bit Orbit 等等。
每套模板都拥有完整的视觉系统,包括字体、配色、装饰元素和翻页导航。



它还内置了完整的 Agent 操作手册。
当你对 Claude Code 或 Cursor 说“帮我做个演示文稿”时,AI 会先询问你的场合和氛围,然后从模板库中匹配出 3 个候选方案,生成封面预览供你选择。你选定后,它会再填充完整的内容。
所有模板都是单个 HTML 文件,使用 Google Fonts,内置翻页逻辑,在浏览器中直接打开即可演示,零依赖。
- 开源地址:https://github.com/zarazhangrui/beautiful-html-templates
07
从零开始学习 AI Agent 的中文路线图
这份开源的学习地图,将带你从零开始学习 AI Agent。
它将学习路径划分为 7 个阶段。前三个阶段是打基础,学习 Python、LLM 和 Prompt Engineering。

之后分为两条轨道:Track A 是 CLI Power User,教你如何使用现成的 Agent 工具来提升效率。
08
Codex App 的增强补丁
**

**
在使用 OpenAI Codex App 的过程中,用户常会遇到两个痛点:通过 API Key 登录时,插件入口无法使用;以及只能归档会话,却不能直接删除。
Codex++ 正是为解决这两个问题而生的。

它借助 Chromium DevTools Protocol 注入脚本,解锁了 API Key 模式下的插件功能,并支持强制安装特殊插件。
此外,它还新增了会话删除按钮。该功能会优先尝试从服务端删除,若失败,则回退到本地 SQLite 数据库进行删除,且在删除前会提供确认与撤销的选项。
在架构上,Codex++ 采用非侵入式设计,不会修改 Codex App 的安装目录,而是通过外部 launcher 来启动。


在 macOS 上安装后,系统会在 Applications 目录中生成一个 Codex++.app,用户直接启动它即可。
该项目同时支持 Windows 和 macOS 两大平台。
- 开源地址:
https://github.com/BigPizzaV3/CodexPlusPlus
09
一行命令获取 root 权限
这个项目比较特殊,它并非一个工具,而是一条影响几乎所有主流 Linux 发行版的本地提权漏洞链。
Dirty Frag 利用了 Linux 内核网络子系统中的两个漏洞,将它们组合起来,可以通杀 Ubuntu、RHEL、CentOS、Fedora、openSUSE 等主流发行版。

最令人震惊的是,这个漏洞是确定性的,无需竞争条件,成功概率极高。
只需一行命令,就能让普通用户直接提权到 root。
这两个漏洞相互补充:xfrm-ESP 变种提供了任意 4 字节的写入原语,在 RHEL/CentOS/Fedora/openSUSE 上有效。
而 RxRPC 变种则不需要 namespace 权限,在 Ubuntu 上有效。
两者结合,就构成了一个能通杀所有发行版的 exploit。

其利用手法也相当精巧。
ESP 变种通过修改 /usr/bin/su 的页缓存,用一个 192 字节的微型 ELF 文件替换掉前 192 字节,从而绕过 PAM 直接获取 root shell。
RxRPC 变种则更为直接,它修改 /etc/passwd 文件的第一行,清空密码字段,利用 PAM 的 nullok 配置实现无密码 su。
这个漏洞的有效生命周期大约为 9 年,自 2017 年起就已存在。如果你的服务器还在运行旧版内核,请立即打上补丁。
- 开源地址:
https://github.com/V4bel/dirtyfrag
10
Vercel 打造的 Tauri 竞品
Vercel Labs 最近发布了一个新项目 zero-native,它使用 Zig 语言编写原生 Shell,并结合 Web UI 来构建界面,最终产物体积极小,重建速度极快。

它支持两种 Web 引擎:系统 WebView 和 Chromium。
使用系统 WebView 时,体积最小。macOS 上使用 WKWebView,Linux 上则使用 WebKitGTK。
如果需要一致的渲染表现,可以切换到 CEF(内嵌 Chromium),只需在配置文件中修改一行代码即可。
原生层使用 Zig 编写,编译速度飞快。
前端方面,它支持 Next.js、React、Svelte、Vue 等主流框架,开发者可以使用熟悉的 Web 工具链进行开发。
其安全模型也设计得相当不错。
WebView 默认被视为不可信环境,原生命令、权限、导航、外部链接等都需要通过 opt-in 策略进行控制。
JS 到 Zig 的 bridge 经过了大小限制、origin 检查以及权限检查等多重验证。
- 开源地址:
https://github.com/vercel-labs/zero-native
Track B: Agent Builder
Track B 是 Agent Builder,涵盖从零开始构建 Agent 到 Multi-Agent 编排的全过程。总时长预计为 14 到 19 周。

最值得称赞的是其三语对照版本,包含了繁体中文、简体中文和英文三种语言。
每个阶段都配有 1 到 5 个 mini project,并设有成功标准,绝非那种只看文档不动手的课程。
该课程总共收录了 145 个精选项目和资源,并提供了 5 条按身份分流的延伸路线,分别面向研究员、开发者、老师、知识工作者和日常使用者。
- 开源地址:
https://github.com/WenyuChiou/awesome-agentic-ai-zh
11
点击下方卡片,关注逛逛 GitHub
这个公众号历史上发布过许多有趣的开源项目。如果你懒得翻看文章一个个找,可以直接关注微信公众号:逛逛 GitHub,在后台对话聊天即可:
关注“鲸栖”小程序,掌握最新AI资讯
本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/archives/34402

