AI产业动态

  • AI周报:智谱GLM-4.6V革新视觉Agent,谷歌Gemini 2.5与OpenAI GPT-5.2齐发,多模态与智能体技术迎来爆发期

    12月8日 【开源】 智谱AI发布GLM-4.6V系列多模态大模型,包含GLM-4.6V(106B)云端版和GLM-4.6V-Flash(9B)轻量版。该系列模型支持128k超长上下文,在同参数规模下实现了视觉理解SOTA性能。其最大亮点在于首次将Function Call能力原生融入视觉模型架构,打通了从“视觉感知”到“可执行行动”的完整链路,为多模态Ag…

    2025年12月15日
    10900
  • UnityVideo:统一多模态训练范式,开启视频生成模型的“物理世界理解”新纪元

    在人工智能领域,视频生成技术正经历从单一模态学习向多模态统一理解的深刻变革。近期,由香港科技大学、香港中文大学、清华大学与快手可灵团队联合提出的UnityVideo框架,通过整合深度图、光流、骨骼姿态、分割掩码等多种视觉模态,构建了一个能够“理解”物理世界规律的视频生成模型。这一突破不仅显著提升了生成视频的真实性与可控性,更实现了零样本泛化能力,为视觉大模型…

    2025年12月14日
    7500
  • 从金融深水区到产业级应用:蚂蚁数科Agentar-SQL开源背后的AI方法论

    近日,蚂蚁数科在第二届CCF中国数据大会上正式宣布开源其数据智能体关键技术——Agentar-SQL系列,这一举动在AI数据分析领域引发广泛关注。此次开源不仅包含实时文本转SQL(Text-to-SQL)框架的全套论文、代码、模型和使用指南,更标志着中国AI企业在核心技术开放共享方面迈出重要一步。 要理解这一开源事件的意义,必须从技术实力和市场表现两个维度深…

    2025年12月14日
    11800
  • Poetiq元系统:以智能编排重塑大模型推理范式,成本减半性能登顶ARC-AGI-2

    在人工智能快速演进的浪潮中,大模型的能力边界不断被拓展,但如何高效、低成本地调用这些模型解决复杂现实问题,仍是行业面临的重大挑战。近日,由6名前Google DeepMind核心成员创立的初创公司Poetiq,通过其创新的“元系统”架构,在这一领域取得了突破性进展。该系统不仅以54%的准确率在ARC-AGI-2基准测试中刷新纪录,更将每任务计算成本降至31美…

    2025年12月14日
    8500
  • GPT-5.2 vs Gemini 3 Pro:年度AI对决的深度技术剖析与产业格局演变

    在人工智能领域竞争白热化的2025年,OpenAI与谷歌之间的技术对决达到了前所未有的激烈程度。GPT-5.2作为OpenAI年度重磅产品,在发布48小时内即面临来自各方的严格审视,而谷歌Gemini 3 Pro则凭借卓越表现重新定义了行业标杆。这场对决不仅关乎单一产品的成败,更折射出两大科技巨头在技术路线、研发策略和市场布局上的根本差异。 Epoch AI…

    2025年12月14日
    7700
  • 华人学者闪耀2025届美国国家发明家科学院院士榜单:占比20%背后的创新力量与全球影响

    近日,美国国家发明家科学院(National Academy of Inventors, NAI)正式公布了2025届院士名单,共有185位杰出发明家入选,其中华人学者约37人,占比高达20%。这意味着平均每五位NAI院士中就有一位华人,这一数据不仅彰显了华人在全球科技创新领域的卓越贡献,也反映了国际科研生态中多元文化融合的积极趋势。 NAI院士是美国政府授…

    2025年12月14日
    7900
  • 神经网络权重空间的柏拉图式启示:通用子空间假说如何重塑AI架构认知

    近期,约翰斯・霍普金斯大学的一项突破性研究揭示了神经网络训练中一个令人震撼的规律:超过1100个在不同数据集、不同初始化条件下训练的神经网络,其最终学到的权重都会收敛到一个共享的低维子空间。这一发现不仅挑战了传统机器学习中“数据驱动一切”的范式,更暗示着神经网络架构本身可能蕴含着某种先验的数学结构——所有训练过程本质上都是在“发现”而非“创造”这个早已存在的…

    2025年12月14日
    8800
  • 突破硬件限制:异步采集与视频扩散模型协同实现低成本高速4D重建

    在三维视觉领域,捕捉高速动态场景并将其转化为可供分析、交互的数字化4D时空一直是个技术难题。无论是影视制作中需要捕捉的瞬间动作细节,还是虚拟现实应用中用户期望的沉浸式交互体验,都对高速4D重建技术提出了迫切需求。然而,传统方法面临硬件成本高昂、数据通量巨大等瓶颈,难以实现大规模应用。 当前4D采集技术主要面临两大挑战。硬件方面,传统高速摄影需要120FPS甚…

    2025年12月14日
    9800
  • 谷歌联合创始人谢尔盖·布林斯坦福对谈:AI浪潮下的学术基因、Transformer遗憾与未来大学形态

    在斯坦福大学工程学院百年庆典的收官活动中,谷歌联合创始人谢尔盖·布林重返母校,与校长Jonathan Levin及工程学院院长Jennifer Widom展开了一场深度对话。这场对话不仅回顾了谷歌二十余年的创新历程,更触及了人工智能时代下学术界与产业界的核心命题——从Transformer论文的错失良机,到未来大学的形态演变,布林以亲历者视角提供了珍贵的一瞥…

    AI产业动态 2025年12月14日
    8900
  • 从指令到协作:基于Anthropic研究的10个高效提示工程技巧深度解析

    在人工智能交互领域,提示工程已从简单的指令输入演变为一门精细的协作艺术。Greg Isenberg近期发布的深度视频《我用错了Claude》基于Anthropic官方研究,系统拆解了10个能显著提升AI模型效率的技巧,这些方法不仅适用于Claude,对各类大语言模型均有普适价值。本文将从技术原理、应用场景和思维转变三个维度,对这些技巧进行详细分析。 这些技巧…

    2025年12月14日
    8300