AI Agent
-
AI Agent评测进入下半场:从“看答案”到“看行动”,Claw-Eval如何防止系统放水?
今天的 AI Agent 越来越像能真正干活的数字员工:可以调用 API、查询数据库、撰写邮件、修改代码、安排日程、生成报表。但真正的难题并非它“会不会说”,而是两个更实际的问题:它到底有没有真正完成任务?以及我们用来测试它的任务,是否还代表当下真实世界最重要的工作流程? Claw-Eval 回答了前者,Claw-Eval-Live 回答了后者。前者解决的是…
-
一句话生成桌面应用!KroWork让普通人秒变工具制造者,AI Agent不再烧钱
AI Agent 最近闹出的「事故」,一个比一个离谱。 上个月,PocketOS 创始人 Jer Crane 让 Cursor 执行了一次常规的数据库迁移。Agent「理解」了任务,然后给出了自己的判断:先清空,再重建。问题是,它只完成了前半句。 9 秒。生产数据库连同备份,被清理得干干净净。 事后,Agent 自己写了一段复盘,翻译成人话就三句:我猜了,我…
-
AI先驱Karpathy警告:你的编程技能正在过时,LLM正在蒸发整个软件层
硅谷向来擅长创造新词汇,也擅长迅速将它们抛弃。 去年,人们还在热议“vibe coding”——一种近乎即兴的编程方式:与模型对话、描述需求、快速生成代码。它代表着软件生产门槛的骤降,也象征着一种轻盈乐观的技术气质。 但在今年的 Sequoia Ascent 峰会上,曾推动这一说法流行的 AI 先驱 Andrej Karpathy(以下简称 AK),却抛出一…
-
小米AI 4小时手搓macOS!国产Agent MiMo-V2.5 Pro开源,长程任务吊打GPT-5.4
先别讨论什么参数和基准测试了,来看个硬核操作—— 小米版“macOS Sequoia”桌面系统(狗头)。 开机动画、用户登录、窗口管理、Dock栏缩放、Spotlight搜索、明暗显示风格、Launchpad启动台,一应俱全。 还内置了54个原生应用,打开计算器能算账,打开日历能看日期,打开地图能查地址,打开备忘录能记录,Grapher还能绘制3D函数图………
-
极致极简的AI Agent内核:pi-mono凭何拿下4万Star?
2026 年,几乎每个人都想打造一个属于自己的 AI Agent。 不需要从零开始摸索,也无需重复造轮子。 今天要推荐的这款开源项目,已经把 Agent 的底层架构打磨得异常精简。如果你想开发自己的 Agent,这个项目非常值得深入研究。 它叫 pi-mono。 OpenClaw 的核心运行时,正是基于 Pi 的 SDK 构建的。 OpenClaw 的 RE…
-
会聊天的AI小猫入驻桌面,SentiCat实测:写报告做PPT,国产自研能力亮眼
这么可爱的AI小猫,现在住我电脑桌面上了! 能陪聊,能干活,还能提供情绪价值。 上班累了就找她摸摸鱼,真的感觉心都化了…… 这个抱着AI小猫的女孩叫SUSU,她们都来自AI初创公司SentiPulse思维光谱自主研发的AI Agent产品——SentiCat。 SentiCat拥有三大核心能力:办公自动化、深度研究、代码开发。不管是写报告、做PPT,还是帮你…
-
Hermes Agent 记忆管理不再乱:MemOS 插件让 AI 越用越聪明
最近观察到一个有趣的现象:越来越多用户正从 OpenClaw 迁移到 Hermes Agent。我身边不少朋友切换后也表示“回不去了”。 我本人也深度使用了一个多月,体验确实出色。今天,我想聊聊 Hermes 本身,以及由记忆张量 MemTensor 团队开发的一款本地记忆插件。这款插件旨在让记忆存得更聪明、找得更准,将整体使用体验提升到了一个新的层次。 0…
-
GBrain:给AI Agent装上长期记忆,12天搭出自治系统
还记得前段时间在开发者圈爆火的 GStack 吗? 简单回顾一下,这是由 Y Combinator 现任总裁兼 CEO Garry Tan 开源的一套专为 AI 编写代码设计的 Skill 工作流,目前已在 GitHub 上获得了超过 7 万颗星,每天有 3 万开发者在使用,堪称 Claude Code 生态中的模板级项目。 就在几天前,Garry Tan …
-
MiniMax如何借助阿里云重塑Agent底座,撑起智能体时代的系统变革
2026年初,随着OpenClaw的爆火,AI领域正式步入了Harness时代。在这场技术浪潮中,MiniMax凭借敏锐的技术洞察,成为变革的核心参与者之一。 其近期相继推出的云端AI助手MaxClaw以及全新发布的MaxHermes便是例证。这两款应用分别基于OpenClaw架构与近期备受关注的Hermes Agent构建,旨在消除本地部署服务器与配置AP…
-
硅谷新宠Hermes Agent一夜爆火:GitHub狂揽6.6万星,原生接入微信引爆开发者圈
硅谷新宠Hermes Agent近期受到广泛关注,不仅在GitHub上获得大量关注,其原生接入微信的功能也引发了开发者社区的讨论。近日,首篇以Hermes署名的研究论文也已发布。 Hermes Agent的热度持续攀升。目前,它在OpenRouter平台上的Token日消耗量已位居第二,仅次于OpenClaw。同时,该应用在全球“编程应用”榜单中位列第一,在…
