大模型工程

  • Context7架构革命:子代理架构如何将AI上下文消耗降低65%?

    VibeCoding 必备的 MCP 工具之一 Context7 刚完成了一次重要的架构重构,旨在解决上下文臃肿问题,让 AI 更高效地获取项目文档。此前,用户的一个简单问题,系统就会拉取大量文档,平均上下文大小达到 3000 tokens。这不仅拖慢了响应速度,还增加了不必要的成本。 新架构细节 针对这一问题,团队对产品做了一个关键改进:子代理架构。开发者…

    2025年12月27日
    12500
  • 阶跃星辰发布NextStep-1.1:自回归流匹配模型通过RL增强大幅提升图像生成质量

    当国产大模型在年底轮番冲刺、热议不断时,阶跃星辰一度显得颇为安静。 Kimi凭借K2模型重获关注,智谱与MiniMax在发布新SOTA模型的同时推进IPO进程,DeepSeek也因新功能引发热议。相比之下,作为“六小龙”中坚持自研路线的选手,阶跃星辰近期的声量似乎有所减弱。 直到其最新图像模型 NextStep-1.1 的发布,打破了这份“安静”。 Next…

    2025年12月27日
    11000
  • Virtually Being:多视角身份一致视频生成框架,让AI真正“看清”人物

    第一作者徐源诚是 Netflix Eyeline 的研究科学家,专注于基础 AI 模型的研究与开发,涵盖多模态理解、推理、交互与生成,重点方向包括可控视频生成及其在影视制作中的应用。他于 2025 年获得美国马里兰大学帕克分校博士学位。 最后作者于宁是 Netflix Eyeline 资深研究科学家,带领视频生成 AI 在影视制作中的研发。他曾就职于 Sal…

    2025年12月27日
    10500
  • ClaudeCode之父自曝:上月未开IDE,AI已写200个PR!Karpathy预警软件业9级地震,新人反成AI原生高手

    圣诞节当天,ClaudeCode 的创造者 Boris Cherny 在 X 上宣布,他将开始更积极地参与平台上的讨论。 大家好,我是Boris,我在Claude Code工作。我打算开始在X上更活跃一些,因为这里有很多关于人工智能和编程的讨论。 欢迎随时向我反馈 Claude Code 的使用体验或提交 bug 报告。我很想了解大家是如何使用 Claude…

    2025年12月27日
    12400
  • GraphRAG深度解析:融合Neo4j与LangChain,构建下一代知识增强型LLM系统

    LLM 已从根本上改变了我们与数据交互、自动化推理以及构建智能系统的方式。然而,尽管其生成式能力令人印象深刻,LLM 天生并不理解关系、结构或长期的事实一致性。这一缺陷在我们尝试将 LLM 用于企业级知识系统、多跳推理或决策关键型应用时尤为明显。 这正是图数据库与 RAG 结合之处,二者共同为 AI 系统形成一种新的架构范式——将符号推理与神经生成相融合。 …

    2025年12月27日
    8200
  • 华为诺亚&港中文发布SCOPE框架:让LLM Agent从错误中学习,实现Prompt自我进化

    在 LLM Agent 领域,一个常见的问题是:Agent 明明“看到了”错误信息,却总是重蹈覆辙。 当 Agent 遇到工具调用错误时,错误日志里往往已经包含了解决方案——正确的参数格式、有效的 API 用法、甚至是直接可用的替代方案。然而,静态的 Prompt 无法让 Agent 从这些反馈中“学到教训”,导致它们陷入“错误循环”:承认失败,却重复同样的…

    2025年12月26日
    9600
  • Gemini 3 揭示AI研发新范式:从算法灵感转向系统工程,精细化时代如何重塑智能进化?

    内容来源 —— “We’re Ahead of Where I Thought We’d Be — Gemini 3 & the Future of AI”观看网址:https://www.youtube.com/watch?v=cNGDAqFXvew 在AI模型性能持续突破的今天,我们或许需要重新审视一个问题:驱动智能进化的,究竟是偶然的算法灵感,…

    2025年12月26日
    8400
  • 2026年Python框架新趋势:12个现代框架重塑开发体验

    近年来,Python 框架生态发展迅猛。传统上,Django 常被用于重型项目,而 Flask 则以其轻量灵活著称。然而,展望 2026 年,游戏规则已然改变。 新一代框架正在崛起,它们专为解决现代开发挑战而生:高并发性能、服务器驱动式 UI 以及跨平台的无缝部署。从底层由 Rust 驱动、性能可与 Node.js 比肩的引擎,到无需编写 JavaScrip…

    2025年12月26日
    13000
  • 智谱AI唐杰:领域大模型是伪命题,在线学习与自我评估将成新Scaling范式

    清华大学教授、智谱AI首席科学家唐杰近期发表长文,总结了其对2025年大模型发展的核心观察。文章从预训练、中后训练、Agent、多模态到具身智能等多个维度展开,提出了若干关键论断。 唐杰教授的核心观点在于,大模型正从“学会世界”走向“进入世界”,真正的挑战已从智能本身转向如何将智能转化为现实生产力。 他强调,Agent的落地是模型从认知系统转变为生产系统的关…

    2025年12月26日
    8100
  • 上海云宇星空大模型:6000亿参数重构政务AI,从“能调图”到“敢决策”的深度革命

    当大模型能调图、会统计、会写报告,政务工作流正在被重构。 当下,政务大模型的落地路径,正在分化出两条截然不同的跑道:当不少地方政府选择以“轻量化”的方式,将通用模型快速接入政务系统时,上海市规划和自然资源局给出了一条更“重”、更深的路线。 近日,由上海市规划资源局与商汤大装置联合打造的全国规划资源领域首个基础大模型“云宇星空大模型”(专业版)上线。这并非一个…

    2025年12月25日
    10600