Transformer架构

Depth Anything 3：以极简Transformer架构重塑3D视觉，单目深度估计迈向通用空间感知

近期，字节跳动研究团队发布的Depth Anything 3（DA3）在计算机视觉领域引发了广泛关注。这项研究通过极简的架构设计，挑战了当前3D视觉研究中普遍存在的过度复杂化倾向，为单目深度估计技术开辟了新的可能性。 DA3的核心突破在于其方法论上的根本性简化。研究团队发现，要实现高质量的3D视觉感知，并不需要专门设计的复杂神经网络架构。相反，一个标准的Tr…

2025年11月15日

436000

大模型工程

9张图速览大模型核心技术：从Transformer到AI Agent的全面解析

在 AI 工程领域，RAG（检索增强生成）、LLM（大语言模型）和 AI Agent（智能体）是当前最核心的技术方向。本文通过 9 张可视化图表，系统性地解析其核心概念、技术差异与应用场景，旨在帮助读者快速把握技术脉络。 1. Transformer 与混合专家 (Mixture of Experts) 混合专家（MoE）是一种改进Transformer模…

2025年5月8日

389000