多模态RAG

阿里云百炼引领智能体工业化革命：从手工作坊到AI流水线，企业级应用全面升级

如果 AI 工具早一点出现，我们的很多工作会不会提前几年完成？近日，整个科技圈都在感叹 AI 工具带来的效率提升。一些硅谷 AI 大厂工程师现身说法，表示在使用了 AI 工具后，项目完成时长被大幅压缩。谷歌首席工程师、Gemini API 负责人 Jaana Dogan 分享了她使用智能体的经历。有的人甚至认为，如果在读博时就有 Claude Code、…

2026年1月9日

257000

大模型工程

跨越模态边界：构建真正理解图像、表格与文本的多模态RAG系统

构建多模态 RAG 系统的终极指南三个月前，我们新开发的 AI 应用在诸多看似简单的问题上频频“翻车”。问题根源并非 AI 不够智能或数据不足，而是因为答案蕴含在一张图片里，而当时的系统仅能处理文本。这一时刻迫使我直面一个在构建 RAG 系统时长期回避的核心问题：我们花费数年时间教 AI “阅读”文字，却忽略了人类同样通过图像、表格、公式和流程图来“表达…

2025年12月16日

294000