AI产业动态

  • RICE视觉基座:从全局语义到区域感知的视觉预训练范式演进

    在计算机视觉领域,预训练基座模型的演进正推动着多模态智能的边界。近日,格灵深瞳公司灵感团队发布的视觉模型基座RICE(MVT v1.5)在ICCV25会议上获得Highlight荣誉,标志着视觉表征学习从全局语义理解向细粒度区域感知的重要转变。这一突破不仅刷新了多项视觉任务榜单,更揭示了视觉预训练技术发展的深层逻辑。 MVT系列的发展轨迹清晰地展现了视觉预训…

    2025年10月29日
    9400
  • 《扩散模型原理》专著深度解析:统一理论框架如何重塑生成式AI的未来格局

    扩散模型作为生成式人工智能领域的革命性技术,自2020年以来已彻底改变了图像、音频、视频乃至3D内容的生成范式。然而,其复杂的数学基础和分散的研究视角,使得从业者往往难以系统掌握其核心原理。由Sony AI、OpenAI和斯坦福大学联合撰写的460页专著《The Principles of Diffusion Models》,正是为解决这一困境而诞生的权威指…

    2025年10月29日
    9000
  • Ling-1T技术解析:蚂蚁集团如何通过“Every Activation Boosted”哲学重塑万亿参数推理模型范式

    近日,AI领域权威吴恩达在其《The Batch Newsletter》中重点分析了蚂蚁集团最新开源模型Ling-1T,指出这款非推理(non-reasoning)模型在性能上直逼业界顶尖闭源模型,这一现象背后隐藏着重要的技术转向。吴恩达特别强调,Ling-1T在预训练阶段就强化了思维链(CoT)能力,这种做法“正在模糊推理与非推理模型之间的界限”。这一观察…

    2025年10月29日
    7600
  • 突破文本桎梏:C2C通信范式如何重塑多智能体协作效率

    随着大语言模型在代码生成、数学推理、视觉理解及边缘计算等垂直领域的深度渗透,多智能体系统正成为处理复杂场景任务的关键架构。传统基于文本对话(Text-to-Text,T2T)的协作模式,虽在基础任务中表现尚可,却在面对高维语义传递时暴露出根本性缺陷:信息在文本压缩过程中大量流失、自然语言固有的模糊性导致指令歧义、以及逐token生成机制引发的通信延迟。这些瓶…

    2025年10月29日
    8100
  • 吴恩达深度解析:Agent落地最大瓶颈非技术,人才储备成决胜关键

    如果说两年前AI圈的主旋律是LLMs(大语言模型),那今年Agent无疑成为了最吸睛的技术方向。不过,当概念定义混乱、技术路径尚未成体系的当下,真正能讲清Agentic AI究竟是什么、会带来什么影响的人并不多。 最近,吴恩达在接受硅谷投资人Elad Gil与Sarah Guo的访谈时,深入探讨了智能体AI的崛起及其对行业的深远影响。这位AI领域的资深专家不…

    2025年10月29日
    7300
  • 视觉化文本处理:Glyph框架如何通过图像渲染突破长文本计算瓶颈

    在人工智能快速发展的今天,处理长文本输入已成为大语言模型面临的核心挑战之一。传统的token扩展方法虽然在一定程度上缓解了上下文长度限制,但随之而来的算力成本呈指数级增长,使得百万级token的处理在经济和技术上都变得不可持续。当业界普遍在位置编码扩展和注意力机制优化上投入大量资源时,智谱AI推出的Glyph框架却开辟了一条全新的技术路径:将文本转化为图像,…

    2025年10月29日
    7600
  • 高通进军AI推理芯片市场:挑战英伟达霸权的移动技术新路径

    在人工智能芯片领域,英伟达长期占据主导地位,其GPU在训练和推理市场均形成近乎垄断的格局。然而,这种局面正面临来自多方的挑战。高通作为移动通信和计算领域的巨头,近日宣布将于明年推出AI200芯片,并计划在2027年跟进AI250芯片,正式进军AI推理芯片市场。这一战略举措不仅反映了高通自身业务拓展的雄心,更揭示了AI芯片市场格局可能发生的深刻变化。 高通此次…

    2025年10月28日
    7500
  • 美团视频生成模型来了!一出手就是开源SOTA

    美团推出开源视频生成模型LongCat-Video,该模型在文生视频、图生视频和长视频生成等多个任务上达到先进水平,通过技术创新实现了高质量、长时序的视频内容生成,为视频创作和AI世界模型研究提供了新的工具和思路。

    2025年10月27日
    20700
  • AI大模型技术周报:阿里Qwen3-VL、DeepSeek-OCR、讯飞Spark-Scilit-X1、腾讯混元世界模型重磅更新

    10月21日 【闭源】阿里发布Qwen3-VL-32B系列模型阿里发布了Qwen3-VL-32B-Thinking和Qwen3-VL-32B-Instruct两款32B参数的Dense模型。该系列在文档识别与理解、空间感知与万物识别、视觉2D检测与空间推理等能力上表现优异,适用于通用场景下的复杂感知任务。 详情链接:https://help.aliyun.c…

    2025年10月27日
    8300
  • 小模型专项训练新范式:Karpathy 如何通过数据增强让“蜜蜂大脑”学会字母计数

    近日,OpenAI 联合创始人 Andrej Karpathy 在社交媒体上分享了一项引人深思的实验:他成功训练了一个参数量极小的语言模型 nanochat d32 完成一项看似简单却极具挑战性的任务——准确计算单词中特定字母(如字母“r”)的数量。这一实验不仅展示了小模型在特定任务上的潜力,更揭示了在资源受限条件下,如何通过精心设计的数据增强策略来弥补模型…

    2025年10月26日
    8200