AI产业动态

前OpenAI研究VP挑战Transformer霸权，10亿美元融资打造持续学习AI新范式

Transformer 是当前大语言模型（LLM）发展的核心基础，但一些顶尖研究者正积极寻求替代路径。其中甚至包括 Transformer 的创造者之一、Sakana AI 联合创始人兼 CTO Llion Jones。他在 Sakana 的官方博客中直言不讳地写道：“为什么 Transformer 的这位创造者受够了 Transformer”。 “我不是说…

2026年1月31日

184000

AI产业动态

告别单一成功率：北大团队推出机器人操作评估新范式，实现细粒度质量与来源真实性双重验证

作者介绍* 刘梦源：北京大学深圳研究生院研究员，研究方向为人类行为理解与机器人技能学习。* 盛举义：北京大学在读博士研究生，研究方向为机器人操作技能学习方法。* 王梓懿、李培铭：北京大学在读硕士研究生，研究方向为视频理解分析。* 徐天铭：北京大学在读硕士研究生，研究方向为机器人操作技能学习方法。* 徐天添：中国科学院深圳先进技术研究院集成所研究员，研究领域为…

2026年1月31日

171000

AI产业动态

Voyager：基于HLS的端到端DNN加速器设计框架，实现56%面积优化与61%延迟降低

关键词：Voyager、 DNN Accelerator 、High-Level Synthesis 、Design-Space Exploration 、Quantization 近年来，深度学习模型在计算机视觉、自然语言处理等领域取得了巨大成功，但其庞大的计算量和内存需求对硬件提出了极高要求。传统的通用处理器难以高效运行这些模型，因此设计专用硬件加速器成…

2026年1月31日

173000

AI产业动态

TOON vs JSON：为LLM优化的结构化数据格式革命

在提示词日益冗长、AI模型愈发强大的当下，一个核心问题反复浮现：如何同时降低使用成本和处理时间？在以编程方式使用大语言模型时，结构化输出已成为标准实践。开发者可以要求模型按特定格式输出，例如JSON。通过定义一个模型架构并阐明各字段含义，AI会尽力理解上下文，并在其能力范围内填充输出。这使得处理AI的响应变得前所未有的便捷。然而，输入环节呢？即便我们能…

2026年1月31日

158000

AI产业动态

从戏仿到开源巨兽：OpenClaw的蜕变之路与商业化前瞻

谁曾料想，一个始于周末的业余项目，在短短两个月内便席卷开源社区——GitHub星标数突破10万，单周访问量高达200万。这个项目在三次更名后，最终以“OpenClaw”的身份尘埃落定。名称的演变本身便是一段趣史。2025年11月诞生的“Clawd”，最初是对Claude的戏仿，直到Anthropic的法律团队介入。随后，Discord群组在凌晨五点头脑风暴…

2026年1月31日

157000

AI产业动态

具身智能革命：人形机器人如何跨越死亡谷，开启百万亿市场新纪元

引言：具身智能，AI从“认知”到“行动”的革命当ChatGPT开启了通用人工智能的“认知时代”，AI实现了从“听懂、看懂”到“理解、思考”的跨越；而具身智能的崛起，则正在推开AI“行动时代”的大门，让人工智能真正走出屏幕、走进物理世界，实现“能做、会做、做好”的终极突破。人形机器人作为具身智能的终极载体，凭借类人的形态、灵活的运动能力和自主决策能力，不仅…

2026年1月31日

203000

AI产业动态

马斯克帝国整合：SpaceX、xAI、特斯拉或合并，10万亿IPO创纪录

据彭博社报道，埃隆·马斯克（Elon Musk）旗下的三家公司——商业航天公司SpaceX、人工智能公司xAI以及电动汽车制造商特斯拉——正在考虑合并。消息传出后，美国东部时间1月29日，特斯拉股价在盘后交易中一度飙升4.5%。 ▲美国东部时间1月29日特斯拉股价变化（图源：谷歌财经）目前讨论的核心合并方案主要有两种：其一是SpaceX与特斯拉合并；其二是…

2026年1月30日

218000

AI产业动态

国产AI视频模型Vidu Q3 Pro登顶国际榜单，音画同步16秒直出引领视频生成新突破

国产AI视频模型直接和马斯克的Grok掰手腕了。智东西1月30日报道，今日，来自生数科技的AI视频模型Vidu Q3 Pro登上国际权威AI基准平台Artificial Analysis榜单，位列中国第一，全球第二。这是最新榜单内，首个打入国际第一梯队的国产视频生成模型。它仅次于马斯克旗下xAI的Grok，领先于Runway Gen-4.5、Google…

2026年1月30日

348000

AI产业动态

PaddleOCR-VL-1.5：0.9B参数超越GPT-5.2，异形文档识别新标杆

现阶段，互联网上的公开文本数据已被大模型消耗殆尽，高质量文本数据趋于枯竭，AI 的发展面临瓶颈。要进一步迭代优化，就必须从真实世界中获取更多高质量数据。海量的学术论文、复杂的金融报表、尘封的历史档案等非结构化文档蕴含着极高密度的专业知识，却因物理形态的阻隔，难以被 AI 有效利用。因此，未来的 OCR 文字识别技术，或将成为向 AI 输送高质量「数据燃料…

2026年1月30日

142000

AI产业动态

Vidu Q3：中国AI视频新王者，全球首个16秒音视频直出模型震撼发布

金磊发自凹非寺量子位 | 公众号 QbitAI 开年第一个月，国产AI视频生成领域竞争激烈。 AI视频生成圈迎来重磅发布——全球首个能够一次性直接生成16秒音视频的模型。例如，用它来制作一段真人版《火影忍者》第四次忍界大战的名场面：从画面、台词到音效，都颇具原版日漫的风格。制作这段真人剧的模型，正是生数科技最新推出的Vidu Q3。深度体验后，…

2026年1月30日

223000