大模型工程

LingoEDU：结构化预处理新突破，让大模型生成可溯源，DeepSeek准确率飙升51%

LingoEDU：结构化预处理新突破，让大模型生成可溯源，DeepSeek准确率飙升51% 一种名为LingoEDU（简称EDU，即基本话语单元技术）的新方法，能够零成本降低大模型幻觉，让DeepSeek的准确率相对提升51%。 LingoEDU是一个在大模型正式生成前执行的专用「预处理」模型。其核心在于对输入文本进行精准切分，为每一个最小信息单元（EDU）…

2026年1月5日

226000

HarmonyOS架构深度解析：从分布式能力到实战迁移，解锁万物智联开发新范式

2026年1月10日 13:30，“开发者系列沙龙：‘沪’联万物•智见未来——HarmonyOS架构演进与创新开发实战”即将在上海拉开帷幕。无论你是刚刚接触鸿蒙生态、渴望掌握开发要领的新手，还是已有一定经验、希望深入理解HarmonyOS架构与创新实战的开发者，本次沙龙都将为你搭建一个高质量的学习与交流平台。在这里，你不仅能直面鸿蒙技术专家，掌握Harm…

大模型工程 2026年1月5日

181000

大模型工程

谷歌Cloud AI负责人14年经验：21条反直觉工程法则，从“规模让bug也有用户”到“创新需要偿还”

Addy Osmani 是谷歌 Cloud AI 的总监，专注于帮助开发者和企业通过 Gemini、Vertex AI 和代理开发套件（ADK）取得成功。他在谷歌拥有14年的工作经验，曾参与 DevTools、Lighthouse 和 Core Web Vitals 的开发，拥有 25 年构建网络技术的行业经验，同时也是《超越Vibe编程》《学习 JavaS…

2026年1月5日

340001

大模型工程

Claude Code创始人Boris Cherny亲授：13条高效AI编程实战秘籍，引爆500万在线围观

2026年新年第三天，Claude Code的创始人兼负责人Boris Cherny进行了一场线上教学，亲自演示了他使用这款AI编程工具的个人工作流。他表示，自己的配置可能“简单”得令人意外。Claude Code开箱即用的体验已经非常出色，因此他个人并未进行太多自定义设置。 Boris强调，使用Claude Code没有所谓的“标准答案”。该工具在设计之…

2026年1月4日

275000

大模型工程

通用子空间革命：1100+模型揭示深度神经网络收敛至共享低维空间的秘密

关键词：通用子空间、深度神经网络、低秩子空间、模型可复用性、权重空间分析在大模型时代，一个核心矛盾始终困扰着研究者：我们训练的模型规模持续增长（从百亿到万亿参数），但每次为适配新任务都需要从头微调或训练全新模型。这不仅消耗海量算力，还导致严重的参数冗余。例如，排除任务特定的输入/输出层后，存储500个Vision Transformer（ViT）模型约需8…

2026年1月3日

215000

大模型工程

JEPA-WM：Meta LeCun团队发布物理规划终极指南，让机器人拥有理性大脑

长期以来，AI领域一直怀揣着一个宏大的梦想：创造出能够像人类一样直观理解物理世界，并在从未见过的任务和环境中游刃有余的智能体。传统的强化学习方法往往比较笨拙，需要通过无数次的试错和海量的样本才能学到一点皮毛，这在奖励信号稀疏的现实环境中效率低下。为了打破这一僵局，研究者们提出了“世界模型”这一概念，即让智能体在脑海中构建一个物理模拟器，通过预测未来状态来…

2026年1月3日

178000

大模型工程

北京版幻方开源SOTA代码大模型IQuest-Coder-V1：40B参数性能超Opus-4.5/GPT-5.2，单张3090可运行

IQuest-Coder-V1：性能超群的代码大模型近期，一个名为 IQuest-Coder-V1 的代码大模型系列在科技领域引发广泛关注。在最新的SWE-Bench Verified榜单中，其40B参数版本取得了81.4%的成绩，表现超越了Claude Opus-4.5与GPT-5.2等模型。除了基准测试成绩，其实际代码生成能力同样引人注目。例如，当…

2026年1月2日

281001

大模型工程

深度研究智能体：从信息搜索到自主科研的演进之路

近年来，大模型的应用正从对话与创意写作，走向更加开放、复杂的研究型问题。尽管以检索增强生成（RAG）为代表的方法缓解了知识获取瓶颈，但其静态的“一次检索 + 一次生成”范式，难以支撑多步推理与长期研究流程，由此催生了深度研究（Deep Research, DR）这一新方向。然而，随着相关工作的快速涌现，DR的概念也在迅速膨胀并趋于碎片化：不同工作在系统实现…

2026年1月1日

232000

大模型工程

从BERT到Genie：掩码范式如何铺就通往AGI的世界模型之路

从BERT到Genie：掩码范式如何铺就通往AGI的世界模型之路从OpenAI的Sora到Google DeepMind的Genie，2025年无疑是世界模型（World Model）的爆发之年。然而，繁荣的背后是概念的混战：世界模型究竟是什么？是强化学习里用来训练Agent的环境模拟器？是看过所有YouTube视频的预测模型？还是一个能生成无限3D…

2026年1月1日

175000

大模型工程

GraphMind：构建具备深度推理能力的全栈Agentic RAG架构

GraphMind：构建具备深度推理能力的全栈Agentic RAG架构本文介绍一套可用于生产环境的完整架构，该架构利用GraphRAG流水线将复杂的非结构化数据转化为高准确度、可检索的知识。我们将阐述Chonkie如何通过语义切分保留上下文，Neo4j如何同时存储向量和图表示以实现双重检索，以及LiteLLM如何编排推理流程。同时，文章将解释系统如何通过…

2026年1月1日

269000

分类

排序

大模型工程

LingoEDU：结构化预处理新突破，让大模型生成可溯源，DeepSeek准确率飙升51%

HarmonyOS架构深度解析：从分布式能力到实战迁移，解锁万物智联开发新范式

谷歌Cloud AI负责人14年经验：21条反直觉工程法则，从“规模让bug也有用户”到“创新需要偿还”

Claude Code创始人Boris Cherny亲授：13条高效AI编程实战秘籍，引爆500万在线围观

通用子空间革命：1100+模型揭示深度神经网络收敛至共享低维空间的秘密

JEPA-WM：Meta LeCun团队发布物理规划终极指南，让机器人拥有理性大脑

北京版幻方开源SOTA代码大模型IQuest-Coder-V1：40B参数性能超Opus-4.5/GPT-5.2，单张3090可运行

深度研究智能体：从信息搜索到自主科研的演进之路

从BERT到Genie：掩码范式如何铺就通往AGI的世界模型之路

GraphMind：构建具备深度推理能力的全栈Agentic RAG架构