大模型工程

  • LingoEDU:结构化预处理新突破,让大模型生成可溯源,DeepSeek准确率飙升51%

    LingoEDU:结构化预处理新突破,让大模型生成可溯源,DeepSeek准确率飙升51% 一种名为LingoEDU(简称EDU,即基本话语单元技术)的新方法,能够零成本降低大模型幻觉,让DeepSeek的准确率相对提升51%。 LingoEDU是一个在大模型正式生成前执行的专用「预处理」模型。其核心在于对输入文本进行精准切分,为每一个最小信息单元(EDU)…

    2026年1月5日
    22600
  • HarmonyOS架构深度解析:从分布式能力到实战迁移,解锁万物智联开发新范式

    2026年1月10日 13:30,“开发者系列沙龙:‘沪’联万物•智见未来——HarmonyOS架构演进与创新开发实战”即将在上海拉开帷幕。 无论你是刚刚接触鸿蒙生态、渴望掌握开发要领的新手,还是已有一定经验、希望深入理解HarmonyOS架构与创新实战的开发者,本次沙龙都将为你搭建一个高质量的学习与交流平台。 在这里,你不仅能直面鸿蒙技术专家,掌握Harm…

    大模型工程 2026年1月5日
    18100
  • 谷歌Cloud AI负责人14年经验:21条反直觉工程法则,从“规模让bug也有用户”到“创新需要偿还”

    Addy Osmani 是谷歌 Cloud AI 的总监,专注于帮助开发者和企业通过 Gemini、Vertex AI 和代理开发套件(ADK)取得成功。他在谷歌拥有14年的工作经验,曾参与 DevTools、Lighthouse 和 Core Web Vitals 的开发,拥有 25 年构建网络技术的行业经验,同时也是《超越Vibe编程》《学习 JavaS…

    2026年1月5日
    34000
  • Claude Code创始人Boris Cherny亲授:13条高效AI编程实战秘籍,引爆500万在线围观

    2026年新年第三天,Claude Code的创始人兼负责人Boris Cherny进行了一场线上教学,亲自演示了他使用这款AI编程工具的个人工作流。 他表示,自己的配置可能“简单”得令人意外。Claude Code开箱即用的体验已经非常出色,因此他个人并未进行太多自定义设置。 Boris强调,使用Claude Code没有所谓的“标准答案”。该工具在设计之…

    2026年1月4日
    27500
  • 通用子空间革命:1100+模型揭示深度神经网络收敛至共享低维空间的秘密

    关键词:通用子空间、深度神经网络、低秩子空间、模型可复用性、权重空间分析 在大模型时代,一个核心矛盾始终困扰着研究者:我们训练的模型规模持续增长(从百亿到万亿参数),但每次为适配新任务都需要从头微调或训练全新模型。这不仅消耗海量算力,还导致严重的参数冗余。例如,排除任务特定的输入/输出层后,存储500个Vision Transformer(ViT)模型约需8…

    2026年1月3日
    21500
  • JEPA-WM:Meta LeCun团队发布物理规划终极指南,让机器人拥有理性大脑

    长期以来,AI领域一直怀揣着一个宏大的梦想:创造出能够像人类一样直观理解物理世界,并在从未见过的任务和环境中游刃有余的智能体。 传统的强化学习方法往往比较笨拙,需要通过无数次的试错和海量的样本才能学到一点皮毛,这在奖励信号稀疏的现实环境中效率低下。 为了打破这一僵局,研究者们提出了“世界模型”这一概念,即让智能体在脑海中构建一个物理模拟器,通过预测未来状态来…

    2026年1月3日
    17800
  • 北京版幻方开源SOTA代码大模型IQuest-Coder-V1:40B参数性能超Opus-4.5/GPT-5.2,单张3090可运行

    IQuest-Coder-V1:性能超群的代码大模型 近期,一个名为 IQuest-Coder-V1 的代码大模型系列在科技领域引发广泛关注。 在最新的SWE-Bench Verified榜单中,其40B参数版本取得了81.4%的成绩,表现超越了Claude Opus-4.5与GPT-5.2等模型。 除了基准测试成绩,其实际代码生成能力同样引人注目。例如,当…

    2026年1月2日
    28100
  • 深度研究智能体:从信息搜索到自主科研的演进之路

    近年来,大模型的应用正从对话与创意写作,走向更加开放、复杂的研究型问题。尽管以检索增强生成(RAG)为代表的方法缓解了知识获取瓶颈,但其静态的“一次检索 + 一次生成”范式,难以支撑多步推理与长期研究流程,由此催生了深度研究(Deep Research, DR)这一新方向。 然而,随着相关工作的快速涌现,DR的概念也在迅速膨胀并趋于碎片化:不同工作在系统实现…

    2026年1月1日
    23200
  • 从BERT到Genie:掩码范式如何铺就通往AGI的世界模型之路

    从BERT到Genie:掩码范式如何铺就通往AGI的世界模型之路 从OpenAI的Sora到Google DeepMind的Genie,2025年无疑是世界模型 (World Model) 的爆发之年。 然而,繁荣的背后是概念的混战:世界模型究竟是什么?是强化学习里用来训练Agent的环境模拟器?是看过所有YouTube视频的预测模型?还是一个能生成无限3D…

    2026年1月1日
    17500
  • GraphMind:构建具备深度推理能力的全栈Agentic RAG架构

    GraphMind:构建具备深度推理能力的全栈Agentic RAG架构 本文介绍一套可用于生产环境的完整架构,该架构利用GraphRAG流水线将复杂的非结构化数据转化为高准确度、可检索的知识。我们将阐述Chonkie如何通过语义切分保留上下文,Neo4j如何同时存储向量和图表示以实现双重检索,以及LiteLLM如何编排推理流程。同时,文章将解释系统如何通过…

    2026年1月1日
    26900