鲸林向海 - 未来已来让更多人通往AGI之路

大模型推理

置顶 LLM推理优化全景图：从基础设施到模型算法的全栈工程实践

本文基于真实的企业级AI平台研发与实践经验，首次以“系统分层、功能解耦”的架构思想，自底向上地呈现一幅完整的LLM推理优化全景图。文章详细剖析了从基础设施层（GPU集群、高速网络、存储加速）的硬件基石，到平台与调度层（Kubernetes、高级调度器、KServe）的资源管理中枢，再到服务与容器层的微观优化，以及AI网关层作为智能流量枢纽的核心能力。最终，深入探讨了推理引擎与算法层的核心优化技术，包括KV缓存管理、连续批处理、模型压缩及创新的Prefill/Decode分离架构。

2025年10月2日
528123
大模型评测

AI Agent架构评测：从实验室到生产环境的Skills解耦工程化实践

评测盲区：为什么「能用」不等于「可用」？在大模型评测领域，我们有 MMLU 测知识、HumanEval 测代码、BFCL 测函数调用。但对于 Agent 系统，评测维度往往停留在「任务完成率」这个单一指标上。这里存在一个评测盲区：我们很少评测 Agent 能力的「可迁移性」和「可工程化程度」。举个例子：在 Claude Code 环境中，构建了一套完整…

1天前
28000
大模型工程

Meta AI基础设施十年演进：从GPU集群到自研芯片的下一代蓝图

关键词：基础设施演进、AI集群、大语言模型、GPU扩展、自研芯片我们仍处于人工智能工作负载演进和应用的早期阶段。过去几年我们一直忙碌不停，而未来几年的发展速度将更快。人工智能对硬件提出的需求，丝毫没有放缓的迹象。在过去的21年里，Meta实现了指数级增长，从一个连接美国几所大学数千人的小型社交网络，发展成为拥有多款应用程序和新型硬件产品、服务全球超过34…

1天前
31000
AI时代编程革命：MoltBot之父的20条哲学，揭示从代码打字员到品味制造者的蜕变

MoltBot（Clawdbot）在短短数日内迅速爆火，其传播势头甚至超越了此前的Manus。各大厂商争相推出适配方案，对于一个开源项目而言，这样的传播速度实属罕见，其GitHub星数也以前所未有的斜率增长。作为其开发者，Peter Steinberger近日在一档播客中分享了他对AI的深度思考。以下是提炼出的20条核心观点。 [[IMAGE_1]] 关于心…

大模型工程 1天前
20000
大模型安全

全国首部AI大模型数据流通安全合规标准发布，开启可信数据协作新纪元

2025年12月29—30日，全国数据工作会议在北京召开。会议明确将“推动数据‘供得出、流得动、用得好、保安全’” 列为2026年核心目标，并强调“强化数据赋能人工智能发展”是年度重点工作之一。数据，尤其是高质量、大规模的数据，已成为驱动人工智能大模型进化的“核心燃料”。然而，企业的数据储备再雄厚，也难以支撑千亿级参数模型的持续迭代。跨组织、跨行业、跨地…

1天前
38000
AI产业动态

国产算力新纪元：阿里真武810E GPU性能超越英伟达A800，开启万卡集群时代

前言：算力突围，国产GPU迎来里程碑式突破 2026年1月29日，中国算力产业迎来历史性时刻——阿里平头哥官网上线一款名为“真武810E”的高端AI芯片，这款定位为并行处理单元（PPU）的GPU算力芯片，以“性能超越英伟达A800、支持万卡集群部署、全栈自研软硬件”三大核心亮点，瞬间引爆科技圈与资本市场。这并非一次仓促的新品亮相，而是一场历经六年秘密研发、…

1天前
33000
开源项目

蚂蚁灵波开源最强具身智能大脑LingBot-VLA：20000小时真实数据验证Scaling Law，实现“一个大脑，多个身体”

从3000小时到20000小时：真实数据验证Scaling Law 从3000小时到整整20000小时。真实世界数据中的Scaling Law，直接催生了一个强大的VLA（视觉-语言-动作）基座模型！这就是蚂蚁灵波最新开源的具身智能基座模型——LingBot-VLA。为何称其为当前最强？首先看数据。仅从“20000小时”这个规模来看，LingBot-…

3天前
96000
AI产品库

OpenAI发布Prism：GPT-5.2驱动的免费科研写作平台，开启Vibe Coding式论文创作新时代

OpenAI发布Prism：GPT-5.2驱动的免费科研写作平台，开启Vibe Coding式论文创作新时代就在今天，OpenAI为科研工作者带来了一份重磅礼物——免费的科研写作平台Prism。该平台将GPT-5.2模型深度集成于在线LaTeX编辑器中，能够直接理解论文的完整结构、公式推导与参考文献，标志着论文创作进入了“Vibe Coding”式的新时代…

3天前
39000
大模型评测

Kimi-K2.5-Thinking实测：推理效率提升33%，Agent能力意外滑坡，开源模型新标杆？

月之暗面发布了 Kimi-K2.5-Thinking 新版本，官方称其为“Kimi迄今最智能的模型”，在Agent、代码、图像、视频及一系列通用智能任务上取得了开源state-of-the-art表现。我们对新旧两个版本（Kimi-K2.5-Thinking、Kimi-K2-Thinking）进行了全面的对比评测，测试其在准确率、响应时间、token消耗和成…

3天前
121000
AI产业动态

OpenAI掌门人Sam Altman深度分享：AI未来走向、成本曲线与无限智能体内部实践

昨天，OpenAI 首席执行官 Sam Altman 主持了一场线上 AMA 研讨会。在长达一小时的交流中，Sam Altman 对来自现场及线上观众的一系列问题进行了高密度、快节奏的回应。与会者背景多元，涵盖了斯坦福学生创业者、企业 CTO、独立开发者等 OpenAI 生态的重度用户。 Sam Altman 在研讨会上展现了清晰的逻辑与坦诚的态度，不仅分享…

3天前
35000