大模型工程
-
突破GUI像素瓶颈!面向端侧Agent语义世界建模 MobileWorldBench!1.4M 数据样本驱动 7.4%性能跃升!
关键词: 语义世界建模 、移动智能体 、MobileWorldBench、MobileWorld、 视觉语言模型 、GUI 世界建模 在手机 APP 操作中,我们早已习惯了“点击-反馈”的即时互动——但对 AI 智能体来说,要预判“点击按钮后界面会怎么变”,曾是个棘手难题。 传统 AI 依赖像素级世界建模,试图精准预测未来界面的每一个像素点,却因 GUI(图…
-
GraphRAG革命:知识图谱与向量数据库的协同进化
Knowledge graphs 和 vector databases 常被定位为彼此竞争的技术,但这种框架忽略了问题的本质。 它们是对立的吗?简短回答:不是。 它们解决的是根本不同的问题。事实上,它们最好的状态是协同,而不是对抗。如果你在构建现代 AI 系统,把它们当作对手是一种设计缺陷。 更好的理解方式是: Knowledge Graph = 结构化大脑…
-
Design in Tiles (DiT):自动化框架实现Tile-Based多PE加速器上GEMM高效部署,性能超越英伟达GH200专家库
关键词: Design in Tiles (DiT)、Tile-Based Many-PE Accelerators、GEMM、Automated Deployment、Network on Chip (NoC)、Collective Primitives Design in Tiles: Automating GEMM Deployment on Tile…
-
Context7架构革命:子代理架构如何将AI上下文消耗降低65%?
VibeCoding 必备的 MCP 工具之一 Context7 刚完成了一次重要的架构重构,旨在解决上下文臃肿问题,让 AI 更高效地获取项目文档。此前,用户的一个简单问题,系统就会拉取大量文档,平均上下文大小达到 3000 tokens。这不仅拖慢了响应速度,还增加了不必要的成本。 新架构细节 针对这一问题,团队对产品做了一个关键改进:子代理架构。开发者…
-
阶跃星辰发布NextStep-1.1:自回归流匹配模型通过RL增强大幅提升图像生成质量
当国产大模型在年底轮番冲刺、热议不断时,阶跃星辰一度显得颇为安静。 Kimi凭借K2模型重获关注,智谱与MiniMax在发布新SOTA模型的同时推进IPO进程,DeepSeek也因新功能引发热议。相比之下,作为“六小龙”中坚持自研路线的选手,阶跃星辰近期的声量似乎有所减弱。 直到其最新图像模型 NextStep-1.1 的发布,打破了这份“安静”。 Next…
-
Virtually Being:多视角身份一致视频生成框架,让AI真正“看清”人物
第一作者徐源诚是 Netflix Eyeline 的研究科学家,专注于基础 AI 模型的研究与开发,涵盖多模态理解、推理、交互与生成,重点方向包括可控视频生成及其在影视制作中的应用。他于 2025 年获得美国马里兰大学帕克分校博士学位。 最后作者于宁是 Netflix Eyeline 资深研究科学家,带领视频生成 AI 在影视制作中的研发。他曾就职于 Sal…
-
ClaudeCode之父自曝:上月未开IDE,AI已写200个PR!Karpathy预警软件业9级地震,新人反成AI原生高手
圣诞节当天,ClaudeCode 的创造者 Boris Cherny 在 X 上宣布,他将开始更积极地参与平台上的讨论。 大家好,我是Boris,我在Claude Code工作。我打算开始在X上更活跃一些,因为这里有很多关于人工智能和编程的讨论。 欢迎随时向我反馈 Claude Code 的使用体验或提交 bug 报告。我很想了解大家是如何使用 Claude…
-
GraphRAG深度解析:融合Neo4j与LangChain,构建下一代知识增强型LLM系统
LLM 已从根本上改变了我们与数据交互、自动化推理以及构建智能系统的方式。然而,尽管其生成式能力令人印象深刻,LLM 天生并不理解关系、结构或长期的事实一致性。这一缺陷在我们尝试将 LLM 用于企业级知识系统、多跳推理或决策关键型应用时尤为明显。 这正是图数据库与 RAG 结合之处,二者共同为 AI 系统形成一种新的架构范式——将符号推理与神经生成相融合。 …
-
华为诺亚&港中文发布SCOPE框架:让LLM Agent从错误中学习,实现Prompt自我进化
在 LLM Agent 领域,一个常见的问题是:Agent 明明“看到了”错误信息,却总是重蹈覆辙。 当 Agent 遇到工具调用错误时,错误日志里往往已经包含了解决方案——正确的参数格式、有效的 API 用法、甚至是直接可用的替代方案。然而,静态的 Prompt 无法让 Agent 从这些反馈中“学到教训”,导致它们陷入“错误循环”:承认失败,却重复同样的…
-
Gemini 3 揭示AI研发新范式:从算法灵感转向系统工程,精细化时代如何重塑智能进化?
内容来源 —— “We’re Ahead of Where I Thought We’d Be — Gemini 3 & the Future of AI”观看网址:https://www.youtube.com/watch?v=cNGDAqFXvew 在AI模型性能持续突破的今天,我们或许需要重新审视一个问题:驱动智能进化的,究竟是偶然的算法灵感,…
