MacBook本地跑284B大模型!Redis之父开源神器,KV缓存磁盘化颠覆传统

01

让你的 MacBook 也能本地运行 DeepSeek V4

作为 Redis 的缔造者,antirez 在开源社区堪称传奇。

最近,他带来了一个新项目——ds4。上线仅仅 4 天,便收获了超过 7000 个 Star。

MacBook本地跑284B大模型!Redis之父开源神器,KV缓存磁盘化颠覆传统

ds4 是一个专为 DeepSeek V4 Flash 打造的本地推理引擎,采用 C 语言编写,并针对 Apple Metal 进行了深度调优。

简单来说,它让你能在 MacBook 上运行一个拥有 284B 参数的巨型大模型。

该项目最令人称道的创新点在于其 KV 缓存的磁盘持久化方案。

传统观点认为 KV 缓存只能驻留在内存中,但 antirez 偏偏反其道而行之。

他将 KV 缓存视为与磁盘同等重要的“一等公民”,充分利用现代 MacBook 上速度飞快的 SSD,将 KV 缓存写入磁盘,使得下一次会话可以直接复用。

当你在使用 Claude Code 这类编程 Agent 时,它会反复发送长提示词。以往每次都需要重新进行 Prefill 计算,而现在,直接从磁盘恢复上下文即可,速度提升非常显著。

MacBook本地跑284B大模型!Redis之父开源神器,KV缓存磁盘化颠覆传统

在量化方面,他也下足了功夫。

他采用了 2-bit 不对称量化策略,仅对 MoE 路由专家层进行激进量化,而共享专家层和投影层则保持不变。这种“好钢用在刀刃上”的做法,让配备 128GB 内存的 MacBook 也能顺利运行,并且在编码 Agent 场景下,依然能够可靠地调用工具。

在性能表现上,MacBook Pro M3 Max 128GB 在运行 q2 量化时,长提示词的 Prefill 速度可达 250 tokens/s,生成速度为 21 tokens/s。

而 Mac Studio M3 Ultra 512GB 则更为强劲,长提示词的 Prefill 速度高达 468 tokens/s。

MacBook本地跑284B大模型!Redis之父开源神器,KV缓存磁盘化颠覆传统

此外,它还同时兼容 OpenAI 和 Anthropic 的 API 格式,像 Claude Code、opencode 这类编程 Agent 可以直接无缝对接。

  • 开源地址:https://github.com/antirez/ds4

02

以文件系统的方式操作 Notion

开源项目 Mirage 颇具创意。

它为 AI Agent 构建了一层统一的虚拟文件系统。

MacBook本地跑284B大模型!Redis之父开源神器,KV缓存磁盘化颠覆传统

它将 Google Drive、Slack、Gmail、Redis、GitHub、Notion、Linear、Trello、Discord、Telegram、MongoDB、SSH 等众多服务,全部挂载到同一个虚拟目录树之下。

Agent 只需使用 lscatgrepcp 这些基础的 Unix 命令,就能跨服务进行操作。

该项目提供了 Python SDK、TypeScript SDK 以及独立的 CLI 工具,可以直接嵌入到 FastAPI、Express 或浏览器应用中。

MacBook本地跑284B大模型!Redis之父开源神器,KV缓存磁盘化颠覆传统

它还内置了针对 OpenAI Agents SDK、Vercel AI SDK、LangChain、Pydantic AI 等主流框架的适配层。

uv add mirage-ai # Python
npm install @struktoai/mirage-node  # TypeScript

上线仅一天,Star 数就突破了 1000,它确实解决了 Agent 访问多后端服务时的核心痛点。

  • 开源地址:https://github.com/strukto-ai/mirage

03

91 个中文提示词宝库

这个开源项目收录了 91 个经过实战检验的中文提示词,并按照九大场景进行了分类。

覆盖了 AI 方法、AI 工作、AI 学习、AI 内容、AI 教育、AI 营销、AI 思考等类别,其中内容创作类最多,达到了 49 个。

MacBook本地跑284B大模型!Redis之父开源神器,KV缓存磁盘化颠覆传统

每个提示词都附带了标准化的元数据,清晰说明了其适用场景和使用方法。

项目内部还包含一套智能元提示词生成系统,它基于 RTF 框架,将需求分析、角色工程、任务架构、格式规范和质量评估串联成一个可复用的流程。

MacBook本地跑284B大模型!Redis之父开源神器,KV缓存磁盘化颠覆传统

简单来说,这套流程可以帮助你批量生成高质量的提示词。

  • 开源地址:https://github.com/yaojingang/yao-open-prompts

04

内容创作者的“作弊器”

cheat-on-content 安装到 Claude Code 后,它会通过一个“打分-盲预测-发布-复盘-进化评分公式”的闭环,把你从凭感觉发布内容,转变为可校准的科学实验。

MacBook本地跑284B大模型!Redis之父开源神器,KV缓存磁盘化颠覆传统

其最精妙之处在于防自欺机制。

发布前,你必须写下不可篡改的预测,并由 Hook 强制执行。在 T+3 天后进行复盘,对比实际数据与你的预测。评分公式会在每次循环中进化,但升级必须经过全量重打以及跨模型独立审核。

该项目总共包含 13 个子 Skill。安装完成后,你可以在 Claude Code 中用自然语言触发,比如“打分这篇”、“启动预测”、“复盘”。

MacBook本地跑284B大模型!Redis之父开源神器,KV缓存磁盘化颠覆传统

  • 开源地址:https://github.com/XBuilderLAB/cheat-on-content

05

LLM 推理引擎新秀

TokenSpeed 是一个专为 Agent 工作负载从零开始设计的 LLM 推理引擎,其目标非常明确:

在 NVIDIA Blackwell 上,同时实现 TensorRT-LLM 级别的性能和 vLLM 级别的易用性。

MacBook本地跑284B大模型!Redis之父开源神器,KV缓存磁盘化颠覆传统

其背后的团队阵容相当豪华。

主导方是 LightSeek Foundation(一个非营利组织),协作方包括 NVIDIA DevTech、AMD Triton、通义千问推理团队、Together AI 等。它在 NVIDIA Blackwell 上构建了目前最快的 Multi-head Latent Attention 实现之一。

MacBook本地跑284B大模型!Redis之父开源神器,KV缓存磁盘化颠覆传统

在 Kimi K2.5 的实际测试中,最小延迟场景下,它比 TensorRT-LLM 快了大约 9%;在 100 TPS/User 附近,吞吐量高出约 11%。

更值得一提的是,TokenSpeed 的 MLA 已经被 vLLM 项目所采用,这足以证明其技术实力。NVIDIA AI 官方 Twitter 也转发了该项目,并称其为“专为光速级 Agent 工作负载打造的崭新推理引擎”。

  • 开源地址:https://github.com/lightseekorg/tokenspeed

06

32 套 HTML 幻灯片模板库

这个项目是一个专为 AI 编程 Agent 准备的 HTML 幻灯片模板库。

它收录了 32 套精心设计的模板,风格涵盖 Soft Editorial、Retro Windows、Sakura Chroma、8-Bit Orbit 等等。

每套模板都拥有完整的视觉系统,包括字体、配色、装饰元素和翻页导航。

MacBook本地跑284B大模型!Redis之父开源神器,KV缓存磁盘化颠覆传统

MacBook本地跑284B大模型!Redis之父开源神器,KV缓存磁盘化颠覆传统

MacBook本地跑284B大模型!Redis之父开源神器,KV缓存磁盘化颠覆传统

它还内置了完整的 Agent 操作手册。

当你对 Claude Code 或 Cursor 说“帮我做个演示文稿”时,AI 会先询问你的场合和氛围,然后从模板库中匹配出 3 个候选方案,生成封面预览供你选择。你选定后,它会再填充完整的内容。

所有模板都是单个 HTML 文件,使用 Google Fonts,内置翻页逻辑,在浏览器中直接打开即可演示,零依赖。

  • 开源地址:https://github.com/zarazhangrui/beautiful-html-templates

07

从零开始学习 AI Agent 的中文路线图

这份开源的学习地图,将带你从零开始学习 AI Agent。

它将学习路径划分为 7 个阶段。前三个阶段是打基础,学习 Python、LLM 和 Prompt Engineering。

MacBook本地跑284B大模型!Redis之父开源神器,KV缓存磁盘化颠覆传统

之后分为两条轨道:Track A 是 CLI Power User,教你如何使用现成的 Agent 工具来提升效率。

08

Codex App 的增强补丁

**

MacBook本地跑284B大模型!Redis之父开源神器,KV缓存磁盘化颠覆传统

**

在使用 OpenAI Codex App 的过程中,用户常会遇到两个痛点:通过 API Key 登录时,插件入口无法使用;以及只能归档会话,却不能直接删除。

Codex++ 正是为解决这两个问题而生的。

MacBook本地跑284B大模型!Redis之父开源神器,KV缓存磁盘化颠覆传统

它借助 Chromium DevTools Protocol 注入脚本,解锁了 API Key 模式下的插件功能,并支持强制安装特殊插件。

此外,它还新增了会话删除按钮。该功能会优先尝试从服务端删除,若失败,则回退到本地 SQLite 数据库进行删除,且在删除前会提供确认与撤销的选项。

在架构上,Codex++ 采用非侵入式设计,不会修改 Codex App 的安装目录,而是通过外部 launcher 来启动。

MacBook本地跑284B大模型!Redis之父开源神器,KV缓存磁盘化颠覆传统

MacBook本地跑284B大模型!Redis之父开源神器,KV缓存磁盘化颠覆传统

在 macOS 上安装后,系统会在 Applications 目录中生成一个 Codex++.app,用户直接启动它即可。

该项目同时支持 Windows 和 macOS 两大平台。

  • 开源地址:https://github.com/BigPizzaV3/CodexPlusPlus

09

一行命令获取 root 权限

这个项目比较特殊,它并非一个工具,而是一条影响几乎所有主流 Linux 发行版的本地提权漏洞链。

Dirty Frag 利用了 Linux 内核网络子系统中的两个漏洞,将它们组合起来,可以通杀 Ubuntu、RHEL、CentOS、Fedora、openSUSE 等主流发行版。

MacBook本地跑284B大模型!Redis之父开源神器,KV缓存磁盘化颠覆传统

最令人震惊的是,这个漏洞是确定性的,无需竞争条件,成功概率极高。

只需一行命令,就能让普通用户直接提权到 root。

这两个漏洞相互补充:xfrm-ESP 变种提供了任意 4 字节的写入原语,在 RHEL/CentOS/Fedora/openSUSE 上有效。

而 RxRPC 变种则不需要 namespace 权限,在 Ubuntu 上有效。

两者结合,就构成了一个能通杀所有发行版的 exploit。

MacBook本地跑284B大模型!Redis之父开源神器,KV缓存磁盘化颠覆传统

其利用手法也相当精巧。

ESP 变种通过修改 /usr/bin/su 的页缓存,用一个 192 字节的微型 ELF 文件替换掉前 192 字节,从而绕过 PAM 直接获取 root shell。

RxRPC 变种则更为直接,它修改 /etc/passwd 文件的第一行,清空密码字段,利用 PAM 的 nullok 配置实现无密码 su。

这个漏洞的有效生命周期大约为 9 年,自 2017 年起就已存在。如果你的服务器还在运行旧版内核,请立即打上补丁。

  • 开源地址:https://github.com/V4bel/dirtyfrag

10

Vercel 打造的 Tauri 竞品

Vercel Labs 最近发布了一个新项目 zero-native,它使用 Zig 语言编写原生 Shell,并结合 Web UI 来构建界面,最终产物体积极小,重建速度极快。

MacBook本地跑284B大模型!Redis之父开源神器,KV缓存磁盘化颠覆传统

它支持两种 Web 引擎:系统 WebView 和 Chromium。

使用系统 WebView 时,体积最小。macOS 上使用 WKWebView,Linux 上则使用 WebKitGTK。

如果需要一致的渲染表现,可以切换到 CEF(内嵌 Chromium),只需在配置文件中修改一行代码即可。

原生层使用 Zig 编写,编译速度飞快。

前端方面,它支持 Next.js、React、Svelte、Vue 等主流框架,开发者可以使用熟悉的 Web 工具链进行开发。

其安全模型也设计得相当不错。

WebView 默认被视为不可信环境,原生命令、权限、导航、外部链接等都需要通过 opt-in 策略进行控制。

JS 到 Zig 的 bridge 经过了大小限制、origin 检查以及权限检查等多重验证。

  • 开源地址:https://github.com/vercel-labs/zero-native

Track B: Agent Builder

Track B 是 Agent Builder,涵盖从零开始构建 Agent 到 Multi-Agent 编排的全过程。总时长预计为 14 到 19 周。

MacBook本地跑284B大模型!Redis之父开源神器,KV缓存磁盘化颠覆传统

最值得称赞的是其三语对照版本,包含了繁体中文、简体中文和英文三种语言。

每个阶段都配有 1 到 5 个 mini project,并设有成功标准,绝非那种只看文档不动手的课程。

该课程总共收录了 145 个精选项目和资源,并提供了 5 条按身份分流的延伸路线,分别面向研究员、开发者、老师、知识工作者和日常使用者。

  • 开源地址:https://github.com/WenyuChiou/awesome-agentic-ai-zh

11

点击下方卡片,关注逛逛 GitHub

这个公众号历史上发布过许多有趣的开源项目。如果你懒得翻看文章一个个找,可以直接关注微信公众号:逛逛 GitHub,在后台对话聊天即可:


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/archives/34402

(0)
上一篇 11小时前
下一篇 11小时前

相关推荐

  • DeepSeek V4 编程能力翻倍!开源终端 Agent 让你告别复制粘贴

    DeepSeek V4 的表现确实非常强劲。 它拥有 100 万 token 的上下文、思维链推理能力,而且价格低到了极致,模型本身的实力毋庸置疑。 不过,如果你只是用网页版聊天,V4 的编程能力根本发挥不出来。 你不能直接让它修改文件、运行命令或管理 Git,只能不停地复制粘贴,效率极低。 它完全无法提供类似 Claude Code 的体验。 因此,有人用…

    4天前
    19500
  • GitHub 六大 Agent 开源项目:从零构建智能体,打破信息壁垒

    2025年,无疑是Agent(智能体)元年,GitHub作为重要的学习平台,汇聚了大量优质的开源教程与项目。 01 Hello-Agents 这是由国内社区Datawhale开源的教程,在GitHub上已获得5700+ Star。该教程不仅深入讲解底层原理,更注重实践,手把手指导你编写可运行的Agent代码。它不仅仅是一个代码仓库,更像一本互动式的教科书,旨…

    2025年12月9日
    1.6K00
  • 赛博永生:开源项目colleague-skill五天斩获7K星,将离职同事“炼化”成AI继续打工

    赛博永生:开源项目 colleague-skill 五天斩获 7K 星,将离职同事“炼化”成 AI 继续打工 最近,GitHub 上一个名为 colleague-skill 的开源项目引发了广泛关注。该项目在短短五天内便斩获了超过 7000 颗星,且增长势头迅猛。其项目简介写道:“将冰冷的离别化为温暖的 Skill,欢迎加入赛博永生。” 初看之下,这个项目概…

    2026年4月5日
    98100
  • vphone-cli:在Mac上运行真实iOS系统,开发者调试神器

    vphone-cli:在 Mac 上运行真实 iOS 系统,开发者调试神器 在 Mac 上运行真正的 iOS 系统 vphone-cli 是一个新近开源但迅速流行的项目。它允许开发者在 Mac 上直接引导并启动一个虚拟的 iPhone 设备。需要强调的是,它并非模拟器,而是运行着真实的 iOS 系统。该项目基于苹果原生的 Virtualization 框架实…

    2026年3月15日
    1.1K00
  • 国产8B开源模型碾压30B?商汤SenseNova U1图文生成实测惊艳

    每当用户刚熟悉一种新玩法,总会有新花样紧跟其后。 最近,OpenAI 推出的 GPT Image 2 在全网引发热潮。它不仅擅长生成美观的图片,更让“信息图生成”这一功能火了起来:知识卡片、数据图解、攻略长图、科普海报……只需一句话,就能产出一张排版精致、信息清晰、质感出众的图片。这股风潮的传播速度,丝毫不亚于当年吉卜力风格的刷屏现象。 不过,对于国内用户而…

    2026年4月29日
    52200