19岁小哥10分钟写就的GitHub神器:让AI像山顶洞人说话,Token最高省87%

一款GitHub神器正在走红:让AI“像山顶洞人一样说话”,Token最高节省87%

一款旨在显著节省AI输出Token的开源工具正在GitHub上快速流行。该项目名为 caveman(山顶洞人),其核心理念异常简单:对于AI助手而言,冗长并不总是更好,有时更少的字数意味着更高效的沟通

短短数日,该项目在GitHub上已收获超过4.1K星标,增长势头迅猛。

19岁小哥10分钟写就的GitHub神器:让AI像山顶洞人说话,Token最高省87%

令人意外的是,这个项目的开发者——19岁的Julius Brussee——最初只花了10分钟将其作为一个“玩笑”创建出来,却没想到会受到如此热烈的欢迎。

19岁小哥10分钟写就的GitHub神器:让AI像山顶洞人说话,Token最高省87%

原理:言简意赅,保留精髓

caveman 是一个为Claude Code/Codex等AI编程助手设计的插件。其目标正如其名:让AI助手“像山顶洞人一样说话”,即输出极其简洁、直奔主题的内容。

它通过压缩AI回复中的自然语言部分来实现这一目标,同时完整保留所有技术性内容,例如:
* 代码块和行内代码
* URL、文件路径、命令
* 标题、表格结构
* 日期、版本号

效果对比示例:

  • 普通Claude回复可能需要一段详细的解释:“你的React组件之所以会重新渲染,很可能是因为你在每次渲染周期中都创建了一个新的对象引用…”
  • caveman模式下的回复则极为精简:“每次渲染都会创建新的对象引用。内联对象作为prop传递=新的引用=触发重新渲染。用useMemo包裹起来即可。”

初步测试表明,这种方法能在保持技术准确性的同时,将输出Token减少约75%。

可调节的简洁度与实测效果

用户可以根据需要,选择三种不同的压缩级别:
* Lite:删除客套话和冗余表达,保留基本语法。
* Full(标准模式):省略冠词,输出关键词片段,风格类似“山顶洞人”语言。
* Ultra:极致压缩模式,能省则省。

19岁小哥10分钟写就的GitHub神器:让AI像山顶洞人说话,Token最高省87%

开发者使用真实的Claude API进行了测试,在涵盖代码解释、问题修复、概念说明等10个不同任务中:
* 节省的Token范围在22%到87%之间
* 平均节省高达65%

19岁小哥10分钟写就的GitHub神器:让AI像山顶洞人说话,Token最高省87%

安装与使用

在支持skills的环境(如Cursor、Copilot、Windsurf、Claude Code)中,安装非常简单:
bash
npx skills add JuliusBrussee/caveman

安装后,选择caveman模式或直接对AI助手说“像caveman那样说话”,即可启用。需要停止时,切换回正常模式或说“stop caveman”即可。

项目背后的思考

caveman的流行也印证了一项学术观察:通过施加简洁性约束,大语言模型在某些任务上的准确率可能得到提升。一篇2024年3月的论文发现,强制简短回答能使模型在数学推理和科学知识基准上的表现显著提高。

19岁小哥10分钟写就的GitHub神器:让AI像山顶洞人说话,Token最高省87%

开发者Julius Brussee目前是荷兰莱顿大学数据科学与人工智能专业的大一学生。尽管年纪轻轻,他已多次参与创业项目。对于caveman的意外走红,他感慨道:一个随手写的“玩笑”获得了巨大关注,而自己花费数月精心打磨的其他项目却未能获得同等程度的反响。这让他观察到,传播的关键往往在于能否引起最广泛的共鸣。

19岁小哥10分钟写就的GitHub神器:让AI像山顶洞人说话,Token最高省87%

存在的讨论

当然,caveman的走红也伴随着一些争议和讨论。主要围绕两点展开:

(待续)

  • 该工具主要节省的是输出 Token,而模型推理的主要成本通常来自上下文输入 Token。
  • 一个值得探讨的问题是:强制大模型输出更简洁的内容,是否会影响其推理能力?

19岁小哥10分钟写就的GitHub神器:让AI像山顶洞人说话,Token最高省87%

对此,项目作者也在 Hacker News 评论区进行了详细说明:

这项技能的初衷并非减少模型内部的推理或思考 Token。Anthropic 自家的文档也建议,更多的思考预算通常能提升模型表现,我对此并无异议。

它的目标是精简那些“可见的”输出:减少冗长的开场白、填充内容以及过于精致但非必要的文本。因此,由于输出被“原始化”了,代码生成完全不受此技能影响。

一个合理的批评是,README 中“~75%”的节省数据来自初步测试,而非严格的基准测试。这一点本应更谨慎地表述,我正在准备进行更正式的评估。

19岁小哥10分钟写就的GitHub神器:让AI像山顶洞人说话,Token最高省87%

简而言之,节省成本是附带效果,其核心是减少冗余表达,因此通常不会导致模型能力下降。

在作者看来,“山顶洞人”模式更像一个有趣的概念验证,其适用范围比一些人想象的要窄,后续仍需更精确的基准测试来验证。

这也与部分社区用户的结论相似:

因其趣味性和在减少输出 Token 方面的巧思而值得称赞。

但它并非降低总成本的万能药,甚至可能让 Claude 的输出智商轻微下降。

19岁小哥10分钟写就的GitHub神器:让AI像山顶洞人说话,Token最高省87%

你是否已经尝试过这个工具?欢迎分享你的使用体验。

项目地址:
https://github.com/JuliusBrussee/caveman

参考链接:
[1]https://news.ycombinator.com/item?id=47647455
[2]https://www.reddit.com/r/ClaudeAI/comments/1sble09/taught_claude_to_talk_like_a_caveman_to_use_75/


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/archives/29078

(0)
上一篇 2026年4月7日 下午4:17
下一篇 2026年4月7日 下午5:45

相关推荐

  • 2026年重塑工作流自动化:n8n的15大开源AI应用场景解析

    如果你还在手动在应用之间复制数据、为每个集成编写自定义脚本,或为 Zapier 支付高昂费用——你将很快明白为什么有超过 7,264+ 个 workflow 模板 和 55,000+ 名社区成员 选择用 n8n 来搭建他们的自动化流程。 n8n(读作“n-eight-n”)不只是另一个自动化工具。它是一个开源、可自托管的 workflow 平台,在无代码的易…

    2026年1月9日
    2.9K00
  • iPhone 17 Pro跑400B大模型!Flash-MoE让端侧AI突破物理极限

    有时候看到一些大模型项目,总会怀疑是不是真的有外星人在干预地球科技。 就比如今天这个。 刚看到这个 Demo 时确实有点想笑,已经很久没见过吐词如此缓慢的大模型了。观感上就像“闪电”老师。 尽管每秒只有 0.6 个 tokens 的输出速度,这依然是一项令人难以置信的成果。因为这是一个运行在 iPhone 17 Pro 上的 400B 大模型! 准确来说,这…

    2026年5月2日
    26000
  • AI机器人一夜关闭4000个Issue!开源维护进入自动时代,Codex并行扫描GitHub垃圾堆

    AI机器人一夜关闭4000个Issue!开源维护进入自动时代,Codex并行扫描GitHub垃圾堆 什么?现在,50个Codex可以并行运行,Issues和PRs也能全天候扫描了。 昨天晚上,OpenClaw之父Peter Steinberger发布的最新项目「Clawsweeper」实现了这一切。它是一个专注于控制代码「洪流」的AI维护机器人,负责关闭Op…

    2026年4月26日
    33000
  • 告别人肉调试:OpenClaw+Playwright如何实现真正的AI自动化采集

    每次接到“去这个网站,把几个字段整理成表格”的需求,流程总是固定的:打开开发者工具、分析DOM、写选择器、跑脚本、报错、贴日志、再修改……周而复始。 或许你也尝试过用ChatGPT“提效”:让它生成一段Playwright代码,拷贝运行,出错后再把日志贴回去,反复调整选择器、增加等待、处理弹窗。折腾许久后会发现,这并未实现真正的自动化,只是将手动操作替换成了…

    2026年3月8日
    2.3K00
  • 蚂蚁灵波开源300万对RGB-D数据集,破解空间智能数据瓶颈

    蚂蚁灵波开源300万对RGB-D数据集,破解空间智能数据瓶颈 什么在限制空间智能的落地? 从自动驾驶到具身智能,行业共识指向一个核心要素:数据。数据不足导致模型泛化能力弱,往往只能依赖硬件堆叠来弥补。 这一挑战在机器人领域尤为突出。机器人依赖RGB-D相机来感知三维空间,这类设备能同时获取RGB图像和深度信息。然而,当遇到镜子、电梯门、玻璃等透明或高反光物体…

    2026年3月31日
    35800