-
DeepSeek Engram 记忆神话破灭:外部记忆实为“伪负载”,结构优化才是性能关键
DeepSeek Engram 记忆神话破灭:外部记忆实为“伪负载”,结构优化才是性能关键(上) 关键词:DeepSeek Engram、LLM、外部记忆、 正则化、残差通路 在LLM架构创新中,DeepSeek Engram以“推理与知识分离”为核心主张,凭借外部N-gram记忆表的知识托管、O(1)检索等特性,一度被寄予解决Transformer原生知识…
-
AI Hedge Fund:12位投资大师Agent军团开源,人人可用量化投资
AI 对冲基金:开源 12 位投资大师智能体军团,量化投资触手可及 一个汇集了 12 位世界级投资大师智慧的开源项目,正在 GitHub 上引发关注。该项目名为 AI Hedge Fund,旨在将传奇投资人的哲学编码为智能体(Agent),为用户提供股票分析与交易策略参考。 该系统不仅能让这些“大师级”智能体实时分析市场,还内置了回测模块。用户可以先使用历史…
-
Claude最强“神话”模型Mythos:字节循环架构技术加持,图搜索性能碾压GPT5.4四倍
Claude 最强的“神话”模型 Mythos,其背后可能采用了来自字节的技术架构? 这一猜测近日直接冲上了社交平台的热搜榜。 这款被描述为“强到不敢公开发布”的 Mythos 模型,确实激发了业界对下一代大语言模型架构的想象。社区正在热烈讨论它是否采用了循环语言模型架构。 这一概念源自字节跳动 Seed 团队与多所高校合作发表的一篇学术论文,图灵奖得主 Y…
-
全球第一GUI智能体Mano-P 1.0亮相:断崖领先13.2%,纯视觉操作桌面软件,数据零上云
自从AI智能体展现出在电脑上执行操作的能力以来,人们对其应用场景的想象不断拓展。例如,能否让AI智能体代替用户完成一些复杂的桌面软件操作任务? 然而,现有的一些智能体方案在操作图形用户界面时仍显笨拙。它们往往需要依赖特定的插件或技能库,执行复杂任务时不够流畅,这限制了其在严肃工作流程中的应用。 近期,明略科技发布了其全新进化的面向端侧设备的GUI-VLA智能…
-
Sol-RL:NVIDIA联合团队突破扩散模型强化学习算力瓶颈,FP4探索+BF16训练实现高效对齐
关键词:扩散模型强化学习(Diffusion RL)、NVFP4 量化、两阶段解耦训练、算法-硬件协同设计、GRPO、Blackwell 架构 在文本到图像扩散模型的后训练对齐领域,GRPO 等强化学习方法虽效果显著,却深陷“规模化采样”带来的巨大算力消耗困境。 NVIDIA、香港大学及 MIT 联合团队提出的 Sol-RL 框架,并未采用对模型进行直接粗暴…
-
开源5天斩获5万Star!GSD框架:彻底解决AI上下文腐烂,让Claude Code保持巅峰状态
开源 5 天,收获 5 万 Star。 这一数据在 GitHub 历史上也堪称瞩目。 近期,如果你浏览 X 或小红书等平台,很可能已经接触过一个名为 GSD(Get Shit Done)的开源项目。 在相关讨论中,有人称其为 Claude Code 的“灵魂伴侣”,也有人视其为“氛围编码”的终结者。 深入探究后,发现其设计确有独到之处。 01 GSD 是什么…
-
Google DeepMind重磅研究:AI安全评估体系面临颠覆!操控频率≠实际伤害,隐蔽手法更危险
核心摘要 Google DeepMind的一项大规模研究对当前AI安全评估体系的核心假设提出了根本性质疑。研究发现,AI输出中有害行为(如操控)的发生频率与其造成的实际伤害之间缺乏稳定关联。这意味着,行业普遍依赖的“降低有害输出频率即代表更安全”的逻辑,可能无法有效评估真实风险。 颠覆性发现:操控频率≠实际伤害 今年3月,Google DeepMind在ar…
-
硅谷新宠Hermes Agent一夜爆火:GitHub狂揽6.6万星,原生接入微信引爆开发者圈
硅谷新宠Hermes Agent近期受到广泛关注,不仅在GitHub上获得大量关注,其原生接入微信的功能也引发了开发者社区的讨论。近日,首篇以Hermes署名的研究论文也已发布。 Hermes Agent的热度持续攀升。目前,它在OpenRouter平台上的Token日消耗量已位居第二,仅次于OpenClaw。同时,该应用在全球“编程应用”榜单中位列第一,在…
-
Video-MME-v2震撼发布:揭示大模型视频理解与人类的巨大鸿沟,传统评测指标已“失真”
现有大模型评测分数日趋饱和,但与真实体验差距显著。南京大学傅朝友团队牵头,在 Google Gemini 评测团队邀约下推出视频理解新基准 Video-MME-v2。凭借创新的分层能力体系与组级非线性评分,以及 3300+ 人工时高质量标注,揭示模型与人类的巨大鸿沟(49 vs 90)、传统 Acc 指标虚高、以及 “Thinking” 并非总是增益等现象。…
-
奥特曼豪宅再遭枪击!AI末日论极端分子升级暴力,大模型安全警钟长鸣
OpenAI首席执行官山姆·奥特曼位于旧金山的豪宅在短时间内遭遇第二起袭击,此次袭击者直接开枪射击。身处AI浪潮中心的奥特曼,其个人安全正随着行业争议与个人声望的激增而面临严峻挑战。AI末日论极端分子的暴力行为正在升级,敲响了AI安全与社会治理的警钟。 豪宅再遭袭击,嫌疑人开枪后逃逸 继上周五(4月10日)遭遇燃烧弹袭击后,当地时间周日(4月12日)凌晨,奥…
