大模型工程

突破GUI像素瓶颈！面向端侧Agent语义世界建模 MobileWorldBench！1.4M 数据样本驱动 7.4%性能跃升！

关键词：语义世界建模、移动智能体、MobileWorldBench、MobileWorld、视觉语言模型、GUI 世界建模在手机 APP 操作中，我们早已习惯了“点击-反馈”的即时互动——但对 AI 智能体来说，要预判“点击按钮后界面会怎么变”，曾是个棘手难题。传统 AI 依赖像素级世界建模，试图精准预测未来界面的每一个像素点，却因 GUI（图…

2025年12月28日

227001

大模型工程

GraphRAG革命：知识图谱与向量数据库的协同进化

Knowledge graphs 和 vector databases 常被定位为彼此竞争的技术，但这种框架忽略了问题的本质。它们是对立的吗？简短回答：不是。它们解决的是根本不同的问题。事实上，它们最好的状态是协同，而不是对抗。如果你在构建现代 AI 系统，把它们当作对手是一种设计缺陷。更好的理解方式是： Knowledge Graph = 结构化大脑…

2025年12月28日

195001

大模型工程

Design in Tiles (DiT)：自动化框架实现Tile-Based多PE加速器上GEMM高效部署，性能超越英伟达GH200专家库

关键词： Design in Tiles (DiT)、Tile-Based Many-PE Accelerators、GEMM、Automated Deployment、Network on Chip (NoC)、Collective Primitives Design in Tiles: Automating GEMM Deployment on Tile…

2025年12月27日

237011

大模型工程

Context7架构革命：子代理架构如何将AI上下文消耗降低65%？

VibeCoding 必备的 MCP 工具之一 Context7 刚完成了一次重要的架构重构，旨在解决上下文臃肿问题，让 AI 更高效地获取项目文档。此前，用户的一个简单问题，系统就会拉取大量文档，平均上下文大小达到 3000 tokens。这不仅拖慢了响应速度，还增加了不必要的成本。新架构细节针对这一问题，团队对产品做了一个关键改进：子代理架构。开发者…

2025年12月27日

322000

大模型工程

阶跃星辰发布NextStep-1.1：自回归流匹配模型通过RL增强大幅提升图像生成质量

当国产大模型在年底轮番冲刺、热议不断时，阶跃星辰一度显得颇为安静。 Kimi凭借K2模型重获关注，智谱与MiniMax在发布新SOTA模型的同时推进IPO进程，DeepSeek也因新功能引发热议。相比之下，作为“六小龙”中坚持自研路线的选手，阶跃星辰近期的声量似乎有所减弱。直到其最新图像模型 NextStep-1.1 的发布，打破了这份“安静”。 Next…

2025年12月27日

235000

大模型工程

Virtually Being：多视角身份一致视频生成框架，让AI真正“看清”人物

第一作者徐源诚是 Netflix Eyeline 的研究科学家，专注于基础 AI 模型的研究与开发，涵盖多模态理解、推理、交互与生成，重点方向包括可控视频生成及其在影视制作中的应用。他于 2025 年获得美国马里兰大学帕克分校博士学位。最后作者于宁是 Netflix Eyeline 资深研究科学家，带领视频生成 AI 在影视制作中的研发。他曾就职于 Sal…

2025年12月27日

247000

大模型工程

ClaudeCode之父自曝：上月未开IDE，AI已写200个PR！Karpathy预警软件业9级地震，新人反成AI原生高手

圣诞节当天，ClaudeCode 的创造者 Boris Cherny 在 X 上宣布，他将开始更积极地参与平台上的讨论。大家好，我是Boris，我在Claude Code工作。我打算开始在X上更活跃一些，因为这里有很多关于人工智能和编程的讨论。欢迎随时向我反馈 Claude Code 的使用体验或提交 bug 报告。我很想了解大家是如何使用 Claude…

2025年12月27日

258001

大模型工程

GraphRAG深度解析：融合Neo4j与LangChain，构建下一代知识增强型LLM系统

LLM 已从根本上改变了我们与数据交互、自动化推理以及构建智能系统的方式。然而，尽管其生成式能力令人印象深刻，LLM 天生并不理解关系、结构或长期的事实一致性。这一缺陷在我们尝试将 LLM 用于企业级知识系统、多跳推理或决策关键型应用时尤为明显。这正是图数据库与 RAG 结合之处，二者共同为 AI 系统形成一种新的架构范式——将符号推理与神经生成相融合。 …

2025年12月27日

270000

大模型工程

华为诺亚&港中文发布SCOPE框架：让LLM Agent从错误中学习，实现Prompt自我进化

在 LLM Agent 领域，一个常见的问题是：Agent 明明“看到了”错误信息，却总是重蹈覆辙。当 Agent 遇到工具调用错误时，错误日志里往往已经包含了解决方案——正确的参数格式、有效的 API 用法、甚至是直接可用的替代方案。然而，静态的 Prompt 无法让 Agent 从这些反馈中“学到教训”，导致它们陷入“错误循环”：承认失败，却重复同样的…

2025年12月26日

196000

大模型工程

Gemini 3 揭示AI研发新范式：从算法灵感转向系统工程，精细化时代如何重塑智能进化？

内容来源 —— “We’re Ahead of Where I Thought We’d Be — Gemini 3 & the Future of AI”观看网址：https://www.youtube.com/watch?v=cNGDAqFXvew 在AI模型性能持续突破的今天，我们或许需要重新审视一个问题：驱动智能进化的，究竟是偶然的算法灵感，…

2025年12月26日

219002

分类

排序

大模型工程

突破GUI像素瓶颈！面向端侧Agent语义世界建模 MobileWorldBench！1.4M 数据样本驱动 7.4%性能跃升！

GraphRAG革命：知识图谱与向量数据库的协同进化

Design in Tiles (DiT)：自动化框架实现Tile-Based多PE加速器上GEMM高效部署，性能超越英伟达GH200专家库

Context7架构革命：子代理架构如何将AI上下文消耗降低65%？

阶跃星辰发布NextStep-1.1：自回归流匹配模型通过RL增强大幅提升图像生成质量

Virtually Being：多视角身份一致视频生成框架，让AI真正“看清”人物

ClaudeCode之父自曝：上月未开IDE，AI已写200个PR！Karpathy预警软件业9级地震，新人反成AI原生高手

GraphRAG深度解析：融合Neo4j与LangChain，构建下一代知识增强型LLM系统

华为诺亚&港中文发布SCOPE框架：让LLM Agent从错误中学习，实现Prompt自我进化

Gemini 3 揭示AI研发新范式：从算法灵感转向系统工程，精细化时代如何重塑智能进化？