AI产业动态

  • 前OpenAI研究VP挑战Transformer霸权,10亿美元融资打造持续学习AI新范式

    Transformer 是当前大语言模型(LLM)发展的核心基础,但一些顶尖研究者正积极寻求替代路径。其中甚至包括 Transformer 的创造者之一、Sakana AI 联合创始人兼 CTO Llion Jones。他在 Sakana 的官方博客中直言不讳地写道:“为什么 Transformer 的这位创造者受够了 Transformer”。 “我不是说…

    2026年1月31日
    18400
  • 告别单一成功率:北大团队推出机器人操作评估新范式,实现细粒度质量与来源真实性双重验证

    作者介绍* 刘梦源:北京大学深圳研究生院研究员,研究方向为人类行为理解与机器人技能学习。* 盛举义:北京大学在读博士研究生,研究方向为机器人操作技能学习方法。* 王梓懿、李培铭:北京大学在读硕士研究生,研究方向为视频理解分析。* 徐天铭:北京大学在读硕士研究生,研究方向为机器人操作技能学习方法。* 徐天添:中国科学院深圳先进技术研究院集成所研究员,研究领域为…

    2026年1月31日
    17100
  • Voyager:基于HLS的端到端DNN加速器设计框架,实现56%面积优化与61%延迟降低

    关键词:Voyager、 DNN Accelerator 、High-Level Synthesis 、Design-Space Exploration 、Quantization 近年来,深度学习模型在计算机视觉、自然语言处理等领域取得了巨大成功,但其庞大的计算量和内存需求对硬件提出了极高要求。传统的通用处理器难以高效运行这些模型,因此设计专用硬件加速器成…

    2026年1月31日
    17300
  • TOON vs JSON:为LLM优化的结构化数据格式革命

    在提示词日益冗长、AI模型愈发强大的当下,一个核心问题反复浮现:如何同时降低使用成本和处理时间? 在以编程方式使用大语言模型时,结构化输出已成为标准实践。开发者可以要求模型按特定格式输出,例如JSON。通过定义一个模型架构并阐明各字段含义,AI会尽力理解上下文,并在其能力范围内填充输出。 这使得处理AI的响应变得前所未有的便捷。然而,输入环节呢? 即便我们能…

    2026年1月31日
    15800
  • 从戏仿到开源巨兽:OpenClaw的蜕变之路与商业化前瞻

    谁曾料想,一个始于周末的业余项目,在短短两个月内便席卷开源社区——GitHub星标数突破10万,单周访问量高达200万。这个项目在三次更名后,最终以“OpenClaw”的身份尘埃落定。 名称的演变本身便是一段趣史。2025年11月诞生的“Clawd”,最初是对Claude的戏仿,直到Anthropic的法律团队介入。随后,Discord群组在凌晨五点头脑风暴…

    2026年1月31日
    15700
  • 具身智能革命:人形机器人如何跨越死亡谷,开启百万亿市场新纪元

    引言:具身智能,AI从“认知”到“行动”的革命 当ChatGPT开启了通用人工智能的“认知时代”,AI实现了从“听懂、看懂”到“理解、思考”的跨越;而具身智能的崛起,则正在推开AI“行动时代”的大门,让人工智能真正走出屏幕、走进物理世界,实现“能做、会做、做好”的终极突破。 人形机器人作为具身智能的终极载体,凭借类人的形态、灵活的运动能力和自主决策能力,不仅…

    2026年1月31日
    20300
  • 马斯克帝国整合:SpaceX、xAI、特斯拉或合并,10万亿IPO创纪录

    据彭博社报道,埃隆·马斯克(Elon Musk)旗下的三家公司——商业航天公司SpaceX、人工智能公司xAI以及电动汽车制造商特斯拉——正在考虑合并。消息传出后,美国东部时间1月29日,特斯拉股价在盘后交易中一度飙升4.5%。 ▲美国东部时间1月29日特斯拉股价变化(图源:谷歌财经) 目前讨论的核心合并方案主要有两种:其一是SpaceX与特斯拉合并;其二是…

    2026年1月30日
    21800
  • 国产AI视频模型Vidu Q3 Pro登顶国际榜单,音画同步16秒直出引领视频生成新突破

    国产AI视频模型直接和马斯克的Grok掰手腕了。 智东西1月30日报道,今日,来自生数科技的AI视频模型Vidu Q3 Pro登上国际权威AI基准平台Artificial Analysis榜单,位列中国第一,全球第二。 这是最新榜单内,首个打入国际第一梯队的国产视频生成模型。它仅次于马斯克旗下xAI的Grok,领先于Runway Gen-4.5、Google…

    2026年1月30日
    34800
  • PaddleOCR-VL-1.5:0.9B参数超越GPT-5.2,异形文档识别新标杆

    现阶段,互联网上的公开文本数据已被大模型消耗殆尽,高质量文本数据趋于枯竭,AI 的发展面临瓶颈。 要进一步迭代优化,就必须从真实世界中获取更多高质量数据。海量的学术论文、复杂的金融报表、尘封的历史档案等非结构化文档蕴含着极高密度的专业知识,却因物理形态的阻隔,难以被 AI 有效利用。 因此,未来的 OCR 文字识别技术,或将成为向 AI 输送高质量「数据燃料…

    2026年1月30日
    14200
  • Vidu Q3:中国AI视频新王者,全球首个16秒音视频直出模型震撼发布

    金磊 发自 凹非寺 量子位 | 公众号 QbitAI 开年第一个月,国产AI视频生成领域竞争激烈。 AI视频生成圈迎来重磅发布——全球首个能够一次性直接生成16秒音视频的模型。 例如,用它来制作一段真人版《火影忍者》第四次忍界大战的名场面: 从画面、台词到音效,都颇具原版日漫的风格。 制作这段真人剧的模型,正是生数科技最新推出的Vidu Q3。 深度体验后,…

    2026年1月30日
    22300