AI产业动态
-
突破数据孤岛:Being-H0.5全栈开源具身模型以3.5万小时训练实现跨机器人零样本技能迁移
BeingBeyond团队 投稿 量子位 | 公众号 QbitAI 近年来爆火的具身智能领域长期面对着数据孤立导致的训练困境,一线厂商凭借高投入建立独属于自研型号机器的“数据护城河”,而小厂的资产规模直接反映在数据体量上,限制了其产品专用模型的训练。 BeingBeyond团队 近日发布的Being-H0.5有望改变这一局面。 Being-H0.5是目前训练…
-
揭秘Promptware:大模型安全新威胁的“五步杀链”
当你用企业大模型处理邮件、分析数据乃至控制智能办公设备时,可能尚未意识到——针对大模型的攻击早已超越了“让模型说脏话”的初级阶段。 近期,一项由顶尖安全专家进行的研究揭示:针对大模型的攻击已演变为完整的“恶意软件”形态,研究者将其命名为“Promptware”(提示恶意软件)。这类攻击不再是单次的“提示注入”,而是像Stuxnet、NotPetya等传统高级…
-
UltraRAG 3.0重磅发布:可视化白盒框架,让RAG开发从数月缩短至一周
“验证算法原型只需一周,构建可用系统却耗时数月。” 这句看似调侃的“吐槽”,却是每一位算法工程师不得不面对的真实困境。 今天,清华大学 THUNLP 实验室、东北大学 NEUIR 实验室、OpenBMB 、面壁智能与 AI9Stars 联合发布 UltraRAG 3.0。 针对上述痛点,为科研工作者与开发者打造更懂开发者的技术框架,具备 3 大核心优势: 从…
-
OpenAI商业模式变革:从API收费转向价值共享,AI药物研发成新盈利点
今天一早,OpenAI CEO 山姆·奥特曼在社交媒体上公布了其API业务的收入情况:“仅我们的API业务而言,上个月就增加了超过10亿美元的年度经常性收入(ARR)。” 他进一步表示,公众的注意力大多集中在ChatGPT上,但API团队的工作同样取得了令人瞩目的成就。 奥特曼此举可能意在提振市场信心。近期有消息称,OpenAI正计划进行新一轮融资,目标估值…
-
思维链太长拖慢推理?把它「画」进隐空间!新框架RoT探索大模型隐空间推理新范式
在 LLM 时代,思维链(CoT)已成为解锁模型复杂推理能力的关键技术。然而,CoT 的冗长问题一直困扰着研究者——生成大量的中间推理文本步骤,带来了巨大的计算开销和显存占用,严重制约了推理效率。 为了解决这个问题,研究界近期尝试了「隐式 CoT」(Implicit CoT),即让模型在内部隐状态中完成推理,而不输出具体文本。这种方法虽然速度快,却是一个「黑…
-
AI颠覆编程:英伟达VibeTensor全栈系统,连论文都100%由AI生成
前两天,Node.js 之父 Ryan Dahl 在 X 上断言:「人类编写代码的时代已经结束了。」该帖引发广泛讨论,浏览量已超过 700 万。现在,一个有力的证明出现了。 近日,英伟达杰出工程师许冰(Bing Xu)在 GitHub 上开源了新项目 VibeTensor,展示了 AI 在编程方面的强大能力。 从名字可以看出,这是「氛围编程」(Vibe Co…
-
4款GitHub开源AI技能:视频剪辑、文本去AI化、小红书发布与技能管理工具
视频剪辑 Skill 这是一个名为 videocut-skills 的开源视频剪辑 Skill,能够辅助完成视频处理工作。它可以自动识别视频中的口误、静音片段以及语气词等冗余内容。通过简单的指令,AI 即可自动处理这些片段,从而显著提高剪辑效率。 该 Skill 集成了多种自动化功能,例如使用 Whisper 模型生成字幕,并支持通过词典进行纠错。它利用 F…
-
RaaS崛起:AI Agent作为“硅基员工”如何颠覆传统SaaS定价模式
“硅基员工”上岗!百融云创提出RaaS新范式,引爆海内外技术圈。 1月19日早盘,软件股集体下挫。税务软件巨头Intuit大跌16%,绘图与CRM双龙头Adobe与Salesforce均跌超11%,摩根士丹利追踪的SaaS(软件即服务)指数今年已跌15%,创下2022年以来最差开局。 在美资本市场的抛售潮,能够看出SaaS模式的增长焦虑。SaaS主导美国企业…
-
火山引擎斩获4600万AI大单,日均Tokens调用量突破50万亿,领跑中国MaaS市场
火山引擎日均Tokens调用量已达50万亿量级。 智东西1月23日报道,1月22日,江苏省南京市鼓楼高新科技发展集团有限公司《“人工智能+”产业创新平台》项目发布中标候选人公示,火山引擎 为第一中标候选人,中标金额为4688.35万元。 该项目于2025年12月31日发布招标公告,其项目要求为打造一个基座和两大中心 ,即开放共享的公共技术基座和产业赋能中心、…
-
美团LongCat-Flash-Thinking-2601实测:5600亿参数MoE推理模型,免费但响应慢6倍?
美团近期发布了LongCat-Flash-Thinking-2601模型,作为一款基于MoE架构的5600亿参数大型推理模型,官方宣称其在智能体任务上有显著提升。我们对该模型进行了全面评测,测试其在准确率、响应时间、Token消耗等关键指标上的实际表现。 LongCat-Flash-Thinking-2601版本表现:* 测试题数: 约1.5万* 总分(准确…
