AI产业动态

谷歌端侧双雄：T5Gemma 2架构回归与FunctionGemma智能体革命

在人工智能技术快速演进的浪潮中，谷歌近期在端侧模型领域推出两项重要创新——T5Gemma 2与FunctionGemma，这两项技术不仅代表了谷歌在模型架构上的深度思考，更预示着移动设备智能化的新方向。本文将从技术架构、应用场景和产业影响三个维度，对这两款模型进行深入分析。 T5Gemma 2与FunctionGemma均源自Gemma 3技术家族，但定位截…

2025年12月19日

215000

AI产业动态

AI智能体效能评估标准化：破解企业应用困局的关键路径

随着大模型技术从概念验证迈向规模化应用，2025年企业关注的焦点已从技术探索转向业务实效。IDC最新报告指出，今年将成为企业从“AI实验”转向“通过AI重塑运营”的战略分水岭。在这一转型过程中，AI智能体作为连接技术能力与业务场景的关键载体，被寄予打通落地“最后一公里”的厚望。企业不再满足于基础对话功能，而是迫切需要能够处理复杂业务流程、交付确定性结果的业务…

2025年12月19日

281000

AI产业动态

分割一切、3D重建一切还不够，Meta开源SAM Audio分割一切声音

声音的“外科手术刀”：SAM Audio如何用多模态提示重塑音频编辑的未来当Meta在深夜悄然发布SAM Audio时，音频处理领域迎来了一场静默的革命。这不仅仅是一个新的技术模型，而是一个能够理解人类意图、响应自然交互的智能音频编辑系统。在AI技术不断突破边界的今天，SAM Audio的出现标志着音频处理从工具化向智能化的根本性转变。想象一下这样的场景…

2025年12月19日

257000

AI产业动态

Gemini 3 Flash：谷歌以极致效率重塑AI应用范式，开启规模化智能新时代

在人工智能领域竞争日趋白热化的当下，谷歌于北京时间周四零点正式发布了Gemini 3 Flash模型，这不仅是其2024年大模型战略的收官之作，更标志着AI技术从单纯追求参数规模向效率与智能并重的关键转折。作为基于上个月发布的Gemini 3架构优化而来的高速、低成本模型，Gemini 3 Flash的推出具有多重战略意义：一方面直接对标OpenAI等竞争对…

2025年12月19日

227000

AI产业动态

无需训练即可解锁4D感知：VGGT4D如何从静态3D模型中挖掘动态线索

从静态3D到动态4D的演进挑战以Visual Geometry Transformer（VGGT）和DUSt3R为代表的3D基础模型在静态场景重建领域已展现出卓越性能。然而，当面对包含移动物体（如行人、车辆）的动态4D场景时，这些模型的性能往往显著下降。动态物体的运动不仅会干扰背景几何建模，还会导致严重的相机位姿漂移问题。当前解决方案主要面临两大挑战：一…

2025年12月19日

182000

AI产业动态

摩尔线程LiteGS技术斩获SIGGRAPH Asia银奖：3D高斯溅射重建效率突破性提升

在近期于香港举办的SIGGRAPH Asia 2025国际图形学顶级会议上，摩尔线程凭借其自主研发的3D高斯溅射（3DGS）基础库LiteGS，在3DGS重建挑战赛中荣获银奖。这一成果标志着该公司在下一代图形渲染技术领域取得了重要进展。 3D高斯溅射：图形渲染技术的范式变革3D高斯溅射（3D Gaussian Splatting）是2023年提出的一种革命性…

2025年12月19日

372000

AI产业动态

国产AI实现空间智能突破：SenseNova-SI超越国际顶尖模型，揭示AI技术范式变革

空间智能领域迎来里程碑：SenseNova-SI实现全面超越在空间智能这一前沿研究领域，一项重要进展近日引发行业关注。商汤科技发布的开源模型SenseNova-SI，在多项关键能力评估中超越了李飞飞团队研发的Cambrian-S模型，标志着国产AI技术在该领域取得突破性进展。从空间感知能力的综合评估数据来看，SenseNova-SI在多个维度上的表现均优…

2025年12月19日

217000

AI产业动态

震惊！Gemini 3 Flash幻觉率高达91%：AA-Omniscience基准揭示模型致命缺陷

在业界对Gemini 3 Flash的一片赞誉声中，AA-Omniscience基准测试的最新结果却令人瞠目结舌：该模型的幻觉率竟高达91%，在所有参与测试的模型中位列倒数。所谓幻觉率，是指模型在应当拒绝回答或承认未知时，却错误生成答案的比例，这一指标直接反映了模型的可靠性与准确性。在更为全面的LisanBench测试中，Gemini 3 Flash的表现…

2025年12月19日

697001

AI产业动态

移动端高保真实时3D数字人革命：HRM²Avatar如何用单部手机突破SIGGRAPH Asia

在计算机图形学、三维视觉、虚拟人与XR技术领域，SIGGRAPH Asia作为SIGGRAPH系列两大主会之一，始终代表着全球学术与工业界的最高研究水平与最前沿技术趋势。今年，淘宝技术-Meta技术团队凭借其自主研发的移动端高保真实时3D数字人重建与渲染系统HRM²Avatar，首次登陆这一国际顶级会议，标志着中国在轻量化数字人技术领域实现了重大突破。当前…

2025年12月18日

250000

AI产业动态

火山引擎发布豆包视频生成模型Seedance 1.5 Pro，实现音画高精度同步

火山引擎在FORCE原动力大会上推出最新豆包视频生成模型Seedance 1.5 Pro。该模型主打音画高精度同步功能，能够通过单一Prompt同时生成人物对白配音、背景音乐和音效。 Seedance 1.5 Pro的核心亮点包括： 1. 音画高精度同步：背景音乐、音效和人物对话均能按照剧情发展保持高度一致。 2. 支持多人多方言：原生支持四川话、粤语、上海…

2025年12月18日

257000