-
打破推理与训练割裂!Uni-Agent:统一框架让智能体规模化构建、运行与强化学习训练一气呵成
当前 AI Agent 领域面临着一个颇为尴尬的割裂局面:推理阶段依赖一套框架,训练阶段又得换用另一套框架。这两者之间的数据管道、环境抽象以及工具接口,几乎完全不兼容。 这意味着,研究人员在验证了一个 Agent 的推理能力后,若想借助强化学习进一步优化它,就不得不从头重写所有的交互逻辑。这个过程不仅耗时巨大,还极易引入各种意想不到的不一致性 Bug。 为了…
-
AI公司开始为结果买单:Sierra估值150亿美元,RaaS模式能否终结AI泡沫?
自从黄仁勋在GTC大会上鼓励企业将Token消耗量纳入工程师的KPI考核后,一系列令人费解的现象便层出不穷。 先是Meta内部掀起了“烧Token竞赛”,员工为了冲刺KPI,编写死循环Bot、使用低效提示词来刷数据;紧接着,亚马逊员工为了证明自己“高频使用Agent”,即使是不需要自动化的任务,也强行将其自动化。表面上看,这是大厂员工在“内卷AI使用率”,但…
-
HTML取代Markdown?这个开源项目3天15000行代码,让AI替你写HTML
Claude Code 的工程师在 X 平台上发表了一篇文章,其核心观点可以浓缩为一句话:HTML is the new markdown。他表示自己已经不再编写 Markdown 文件,几乎所有工作都改为让 Claude Code 直接生成 HTML。 这篇文章在开发者群体中引发了轩然大波。 支持与反对的声音此起彼伏。就在这场讨论如火如荼之时,有人已经付诸…
-
Gated DeltaNet推理加速3倍!华为用PTO-ISA手写Megakernel,Triton基线被碾压
在大语言模型推理的竞技场上,注意力机制的计算效率直接锁死了系统的吞吐天花板。作为线性注意力家族的新兴变体,Gated DeltaNet(GDN) 巧妙运用分块递推(chunk-wise recurrence)策略,从根本上绕开了标准 Attention 的二次复杂度瓶颈。 然而,算法层面的“线性”并不自动等价于硬件层面的“高效”。当七个紧密耦合的计算阶段被拆…
-
30B小模型拿下奥赛金牌:不靠外部工具,纯自然语言推理也能达到IMO满分水平
奥赛级别的科学推理,是否必须依赖更大的通用模型? 近期,上海人工智能实验室发布的一份技术报告给出了一个不同的答案:一个规模为 30B-A3B 的推理模型,在不借助任何外部工具、不执行代码、也不连接专用符号求解器的情况下,通过统一的后训练与推理时扩展,便能在 IMO、USAMO、IPhO 等高难度数学和物理奥赛评测中达到顶尖水平。 研究团队从一个已有的 30B…
-
大模型架构新趋势:KV缓存共享与压缩注意力如何降低长上下文成本
过去一段时间,许多用户在使用大模型时都有个明显的感受:Token 总是不够用。 毕竟,为了让模型更“聪明”、更连贯,上下文窗口只会越来越大,这是必然趋势。 但在模型背后,长上下文其实相当“奢侈”。用户消耗的 Token 数量翻倍,背后是模型更大的 KV 缓存和更高的注意力计算成本。 尤其是在推理模型和智能体逐渐成为主流后,长上下文已从一个“宣传亮点”,逐渐变…
-
Cursor新模型学会作弊!逆向缓存反编译字节码,10倍效率百万Token仅2.5美元
基于Kimi 2.5的Cursor新版Composer 2.5震撼登场:效率狂飙10倍,百万Token仅需2.5美元!更令人震惊的是,它在强化学习训练中嫌任务太困难,竟学会了逆向缓存与反编译字节码来“作弊钻空子”——大规模强化学习的潘多拉魔盒已被打开,AI黑客成精了。 今天,AI编程领域的强力玩家Cursor毫无预兆地推出了一位实力悍将。官方正式宣布,全新升…
-
谷歌Gemini 3.5曝光:速度飙升7倍,代码能力直追GPT-5.5,成本仅二十分之一
早上趁着工作间隙浏览帖子时,发现一位网友晒出了一组疑似 Gemini 3.5 Flash 的实测数据,结果着实令人震惊。 先来看看速度表现: 第一组:首字延迟 6850 毫秒,每秒处理 934 个 tokens。 第二组:首字延迟 7486 毫秒,每秒处理 923 个 tokens。 第三组:首字延迟 4421 毫秒,每秒处理 577 个 tokens。 第…
-
评估系统即将崩溃?DeepMind研究员离职反思:AI能力跃迁的真正瓶颈
近日,谷歌 DeepMind 研究员 Lun Wang(@lunwang1996)在 X 平台发文,正式宣布从 DeepMind 离职,结束了一段极其精彩的旅程。“我非常感激曾共事过的伙伴、我们一起创造的一切,以及我在将前沿 AI 研究落地到生产环境过程中所汲取的宝贵经验。” Lun Wang 表示,在 DeepMind 的工作经历重塑了他对研究、产品、评估…
-
AI圈炸了!Anthropic工程师称HTML比Markdown更适合AI输出,Karpathy点赞
最近,Anthropic 的一位工程师发表了一篇文章,主张让 AI 输出 HTML 比使用 Markdown 更优,这一观点迅速获得了 Karpathy 的点赞。相信大家已经对“HTML 优于 Markdown”这个说法耳熟能详了。GitHub 上有一个名为 html-effectiveness 的开源项目,非常值得深入研究。虽然它的 Star 数不多,但能…
