-
OpenClaw重磅更新:Skills安装不再迷茫,控制台界面全面优化,安全漏洞彻底修复
OpenClaw 恢复了高频更新节奏。本次更新内容并非简单的错误修复,更新日志的篇幅也反映了此次变动的分量。其中几项关键改进值得重点关注。 Skills 安装与管理体验显著提升 此次更新对 Skills 的安装与管理流程进行了大幅优化,对普通用户而言感知最为直接。 1. 一键安装配方针对内置的常用 Skills(如 coding-agent、gh-issue…
-
AI Agent 7天自主进化,超越专家数月成果:GPU内核优化性能提升10.5%,开启自主进化搜索新范式
关键词:AI Agent、进化算法、GPU Kernel 优化、FlashAttention、异构计算 在 NVIDIA 最新的 Blackwell GPU 上,一个 AI Agent 用 7 天时间,自主探索了 500 多个优化方向,最终生成的 Attention 内核性能超越了专家团队数月打磨的 cuDNN 和 FlashAttention-4,最高提升…
-
AI圈大地震!全球最难AGI测试ARC-AGI-3上线,人类满分通关,最强模型Opus 4.6仅得0.2%
今天,一项名为ARC-AGI-3的基准测试结果公布,其表现出的巨大“人机差距”在AI研究社区内引起了广泛关注。 作为全球范围内尚未被现有AI能力“饱和”的关键智能基准,ARC-AGI-3对全球顶尖大模型进行了一次全面评估。结果显示,人类在该测试中平均得分高达100%,而所有参与测试的AI模型得分普遍低于1%。 这一差距被形象地比喻为“比珠穆朗玛峰还高”。尤为…
-
MoE模型:稀疏化革命如何突破大语言模型扩展瓶颈?
引言 过去几年,大规模稠密语言模型的扩展是推动大语言模型 (LLMs) 发展的主要动力。从早期如ULMFiT(约3000万参数)或GPT-2(15亿参数)等模型,到如今拥有数千亿参数的系统,其核心扩展思路始终遵循一个简单的范式: 数据越多 + 参数越多 = 性能越好 缩放定律进一步强化了这一趋势。然而,纯粹扩展稠密模型正面临严峻的现实瓶颈:* 训练成本呈指数…
-
Claude Code上线云端自动修复功能:AI自主修bug,程序员彻底解放双手
Claude Code 的产品更新节奏持续加快。本次上线的“云端自动修复”功能,可与几天前推出的“自动模式”结合,实现更完整的自动化工作流。 该功能支持网页端与移动端。当 CI(持续集成)流程报错或 PR 收到评审意见时,Claude Code 会自动分析日志、理解需求,并直接推送附带说明的修复代码。 有开发者体验后表示,整个修复过程无需人工干预,CI 状态…
-
Cursor套壳Kimi风波再起:Composer 2技术报告自证“有技术地套”,网友却不买账
Cursor套壳Kimi的争议仍在继续。 近日,Cursor发布了Composer 2的技术报告,试图证明其并非简单套用,而是进行了有技术含量的、循序渐进的研发工作。 报告强调,其方法核心仍是此前提及的预训练与强化学习相结合的技术路线。 与此前不同的是,Cursor在报告中明确标注了基础模型来源为Kimi K2.5。 这一迅速且明确的署名行为,显示出其态度转…
-
林俊旸离职阿里千问后首次发声:从“推理模型时代”到“智能体时代”的思考转变
林俊旸在离开阿里千问后首次公开发声。他没有回应离职的具体情况或宣布未来去向,而是撰写长文,深入探讨了人工智能领域从“推理模型时代的思考”向“智能体时代的思考”的范式转变。 整篇文章着眼于技术与AI的未来发展方向,但字里行间亦透露出对千问过往技术路线的反思。 他坦率承认:“我们没有全做对”(We did not get everything right)。 千…
-
阿里千问AI助手首次完整形态上车红旗汽车,打造全场景超级管家
阿里AI助手千问现已接入红旗汽车智能座舱。用户驾驶时,可通过自然语音指令,由AI助手完成路线规划、餐厅预订、机票购买等一系列事务。 此次上车标志着千问正从一个手机应用,进化为覆盖眼镜、PC、汽车乃至更多智能硬件的全场景AI助理。这也是通用AI助手首次以完整形态进入车载场景。 千问AI首次上车 传统车载导航在理解复杂意图时存在局限。例如,当用户下达包含多个地点…
-
从PUA到道德经:程序员用职场压力、学术研究与哲学智慧驱动AI的四种奇招
01 用大厂绩效话术驱动 AI 近期,GitHub 上出现了一个思路颇为独特的开源项目。其核心方法可以概括为:将互联网大厂中常见的绩效考核体系,移植到 AI 编程助手的交互中。 具体而言,该技能为 AI 设定明确的绩效目标(如“3.25”),若代码产出不达标,则会收到“毕业警告”或“优化淘汰”等反馈。这本质上是在 System Prompt 中植入了一套模拟…
-
SuperCLUE-OpenClaw:首个中文AI Agent评估基准发布,国产模型表现亮眼
背景介绍 一、OpenClaw介绍 OpenClaw(前身为 ClawdBot/Moltbot)是一个开源的AI Agent框架,由Peter Steinberger创建。作为目前GitHub上最受欢迎的AI Agent项目之一,它拥有超过32.5万颗星标。用户常将其昵称为“龙虾”,因为它像一个常驻电脑的数字助理,能够接收指令、调用工具、读写文件、执行脚本,…
