技术专栏 深入大模型技术内核,从零构建与优化,驾驭AI未来的核心力量 全部专题

  • 置顶 LLM推理优化全景图:从基础设施到模型算法的全栈工程实践

    本文基于真实的企业级AI平台研发与实践经验,首次以“系统分层、功能解耦”的架构思想,自底向上地呈现一幅完整的LLM推理优化全景图。文章详细剖析了从基础设施层(GPU集群、高速网络、存储加速)的硬件基石,到平台与调度层(Kubernetes、高级调度器、KServe)的资源管理中枢,再到服务与容器层的微观优化,以及AI网关层作为智能流量枢纽的核心能力。最终,深入探讨了推理引擎与算法层的核心优化技术,包括KV缓存管理、连续批处理、模型压缩及创新的Prefill/Decode分离架构。

    2025年10月2日
    58012
  • 奥特曼深度剖析:OpenClaw引领长期趋势,Codex或成OpenAI第三核心产品,揭秘AI时代四大隐形矛盾

    近日,OpenAI CEO 山姆·奥特曼(Sam Altman)与思科总裁兼首席产品官 Jeetu Patel 在思科 AI 峰会上进行了一场深度对话。对话中,奥特曼对近期涌现的热门产品、AI 发展的核心矛盾以及 OpenAI 的未来布局发表了见解。 OpenClaw 引领长期趋势,Codex 或成第三核心产品 针对近期备受关注的 OpenClaw 和 Mo…

    AI产业动态 6天前
    500
  • GitHub宝藏:6款小众开源神器,从地图艺术到算法解密,提升你的技术工具箱

    地图海报生成器 这是一个基于 Python 的开源工具,可以将城市地图数据转化为极简风格的艺术海报。 该项目利用 OpenStreetMap 获取地理数据,并通过 Matplotlib 进行渲染,能够为世界上任何一座城市生成高分辨率的地图图像。 它无需复杂的地理信息软件界面,通过简洁的代码或命令行即可完成创作。工具内置了多种主题,如黑色电影、陶土和赛博朋克等…

    6天前
    500
  • 百度 ERNIE-5.0(文心5.0) 体验测试(附完整prompt)

    百度近期正式发布了原生全模态大模型ERNIE-5.0(文心5.0)。该模型参数规模达2.4万亿,采用原生全模态统一建模技术,支持文本、图像、音频、视频等多种信息的输入与输出。 核心结论: 三大亮点 中文语境理解能力较强:对双关语、甄嬛体等风格化内容把握到位。 视觉推理能力可用:在六面体展开图等空间能力测试中表现惊喜,图片计数等场景表现良好。 创意写作完成度高…

    6天前
    400
  • 自适应视觉推理新突破:MoVT范式让AI学会“看图说话”与“文字思考”的智能切换

    本文介绍了复旦大学与阿里巴巴未来生活实验室的研究成果,该工作已被 ICLR 2026 接收。 当前,视觉推理方法主要衍生出两种思考模式:一种是与大型语言模型一致的纯文本思考模式;另一种是更贴近图像本身的视觉化思考模式。这两种模式在不同任务领域各有优势,但现有工作通常只专注于单一模式,未能充分利用二者之间的互补性。 为此,本文提出了 Mixture-of-Vi…

    6天前
    300
  • PaperBanana:北大与谷歌联手推出AI论文插图生成器,顶会级图表一键生成

    你负责写方法,AI负责画 Figure。科研打工人,终于等来「画图解放日」。 还在为论文里的方法框图熬夜画 PPT、拉箭头、对齐字体吗? 一张 Figure 2,动辄几个小时,严重的甚至能耗上几天,科研人的「隐藏副本」不是实验,而是画图。 既要忠于论文原意,又得暗暗符合顶会那套心照不宣的「学术审美」:颜色不能土,布局不能乱,箭头更不能连错。 看起来只是一张图…

    6天前
    400
  • 蚂蚁灵波开源四款具身智能模型:从物理交互出发,探索世界模型新路径

    大模型的革命行将结束,即将开启的会是物理 AI 时代? 上周,图灵奖得主、深度学习先驱 Yann LeCun 对通用人工智能(AGI)发表了自己的最新观点。他认为语言并不等同于智能,预测文本并不意味着理解现实。真实世界纷繁复杂、充满物理性和因果关系,而如今的大语言模型(LLM)几乎无法触及这些。 LeCun 认为,真正的智能必须能像人类一样,在脑海中进行推演…

    6天前
    400
  • 记忆湖MemoryLake:AI第二大脑的规模化实践,引领企业智能决策新纪元

    田晏林 发自 凹非寺 量子位 | 公众号 QbitAI “Your brain is for having ideas, not holding them. ”——Tiago Forte《Building a Second Brain》 LLM是AI的“第一大脑”,记忆平台是AI的“第二大脑”。 畅销书作者Tiago Forte在《构建第二大脑》中曾分享核心…

    6天前
    400
  • 英伟达专家预言:世界建模将取代词预测,开启AI预训练新纪元

    henry 发自 凹非寺 量子位 | 公众号 QbitAI 继“下一个词预测”之后,世界建模将成为新的预训练范式。 这是英伟达机器人主管Jim Fan 给出的最新判断。 他认为,2026年将成为大世界模型(Large World Models)真正为机器人领域以及更广义的多模态AI奠定基础的第一年。 谢赛宁随即转发表示赞同:“事后看来显而易见”。 在这篇长文…

    6天前
    200
  • 告别AI健忘症:构建Claude Code项目记忆系统,每年节省26小时开发时间

    发光的神经网络“大脑”连接到悬浮的文档图标,代表包含 bugs、decisions、configuration files 的项目记忆,便于快速 recall。 一个不到 300 行的 skill,如何变成我最常用的 AI 辅助开发效率工具 想象一下:周二晚上 11 点。你盯着一个似曾相识的报错信息—— “Connection refused on port…

    6天前
    300
点击查看更多