AI产业动态
-
谷歌端侧双雄:T5Gemma 2架构回归与FunctionGemma智能体革命
在人工智能技术快速演进的浪潮中,谷歌近期在端侧模型领域推出两项重要创新——T5Gemma 2与FunctionGemma,这两项技术不仅代表了谷歌在模型架构上的深度思考,更预示着移动设备智能化的新方向。本文将从技术架构、应用场景和产业影响三个维度,对这两款模型进行深入分析。 T5Gemma 2与FunctionGemma均源自Gemma 3技术家族,但定位截…
-
AI智能体效能评估标准化:破解企业应用困局的关键路径
随着大模型技术从概念验证迈向规模化应用,2025年企业关注的焦点已从技术探索转向业务实效。IDC最新报告指出,今年将成为企业从“AI实验”转向“通过AI重塑运营”的战略分水岭。在这一转型过程中,AI智能体作为连接技术能力与业务场景的关键载体,被寄予打通落地“最后一公里”的厚望。企业不再满足于基础对话功能,而是迫切需要能够处理复杂业务流程、交付确定性结果的业务…
-
分割一切、3D重建一切还不够,Meta开源SAM Audio分割一切声音
声音的“外科手术刀”:SAM Audio如何用多模态提示重塑音频编辑的未来 当Meta在深夜悄然发布SAM Audio时,音频处理领域迎来了一场静默的革命。这不仅仅是一个新的技术模型,而是一个能够理解人类意图、响应自然交互的智能音频编辑系统。在AI技术不断突破边界的今天,SAM Audio的出现标志着音频处理从工具化向智能化的根本性转变。 想象一下这样的场景…
-
Gemini 3 Flash:谷歌以极致效率重塑AI应用范式,开启规模化智能新时代
在人工智能领域竞争日趋白热化的当下,谷歌于北京时间周四零点正式发布了Gemini 3 Flash模型,这不仅是其2024年大模型战略的收官之作,更标志着AI技术从单纯追求参数规模向效率与智能并重的关键转折。作为基于上个月发布的Gemini 3架构优化而来的高速、低成本模型,Gemini 3 Flash的推出具有多重战略意义:一方面直接对标OpenAI等竞争对…
-
无需训练即可解锁4D感知:VGGT4D如何从静态3D模型中挖掘动态线索
从静态3D到动态4D的演进挑战 以Visual Geometry Transformer(VGGT)和DUSt3R为代表的3D基础模型在静态场景重建领域已展现出卓越性能。然而,当面对包含移动物体(如行人、车辆)的动态4D场景时,这些模型的性能往往显著下降。动态物体的运动不仅会干扰背景几何建模,还会导致严重的相机位姿漂移问题。 当前解决方案主要面临两大挑战:一…
-
摩尔线程LiteGS技术斩获SIGGRAPH Asia银奖:3D高斯溅射重建效率突破性提升
在近期于香港举办的SIGGRAPH Asia 2025国际图形学顶级会议上,摩尔线程凭借其自主研发的3D高斯溅射(3DGS)基础库LiteGS,在3DGS重建挑战赛中荣获银奖。这一成果标志着该公司在下一代图形渲染技术领域取得了重要进展。 3D高斯溅射:图形渲染技术的范式变革3D高斯溅射(3D Gaussian Splatting)是2023年提出的一种革命性…
-
国产AI实现空间智能突破:SenseNova-SI超越国际顶尖模型,揭示AI技术范式变革
空间智能领域迎来里程碑:SenseNova-SI实现全面超越 在空间智能这一前沿研究领域,一项重要进展近日引发行业关注。商汤科技发布的开源模型SenseNova-SI,在多项关键能力评估中超越了李飞飞团队研发的Cambrian-S模型,标志着国产AI技术在该领域取得突破性进展。 从空间感知能力的综合评估数据来看,SenseNova-SI在多个维度上的表现均优…
-
震惊!Gemini 3 Flash幻觉率高达91%:AA-Omniscience基准揭示模型致命缺陷
在业界对Gemini 3 Flash的一片赞誉声中,AA-Omniscience基准测试的最新结果却令人瞠目结舌:该模型的幻觉率竟高达91%,在所有参与测试的模型中位列倒数。所谓幻觉率,是指模型在应当拒绝回答或承认未知时,却错误生成答案的比例,这一指标直接反映了模型的可靠性与准确性。 在更为全面的LisanBench测试中,Gemini 3 Flash的表现…
-
移动端高保真实时3D数字人革命:HRM²Avatar如何用单部手机突破SIGGRAPH Asia
在计算机图形学、三维视觉、虚拟人与XR技术领域,SIGGRAPH Asia作为SIGGRAPH系列两大主会之一,始终代表着全球学术与工业界的最高研究水平与最前沿技术趋势。今年,淘宝技术-Meta技术团队凭借其自主研发的移动端高保真实时3D数字人重建与渲染系统HRM²Avatar,首次登陆这一国际顶级会议,标志着中国在轻量化数字人技术领域实现了重大突破。 当前…
-
火山引擎发布豆包视频生成模型Seedance 1.5 Pro,实现音画高精度同步
火山引擎在FORCE原动力大会上推出最新豆包视频生成模型Seedance 1.5 Pro。该模型主打音画高精度同步功能,能够通过单一Prompt同时生成人物对白配音、背景音乐和音效。 Seedance 1.5 Pro的核心亮点包括: 1. 音画高精度同步:背景音乐、音效和人物对话均能按照剧情发展保持高度一致。 2. 支持多人多方言:原生支持四川话、粤语、上海…
