AI产业动态
-
腾讯混元开源HY3D-Bench:构建3D生成领域的“ImageNet”,破解数据与评估瓶颈
3D生成技术如今在可用性上已达到令人惊艳的程度。 然而,数据质量参差不齐、评估标准缺失以及长尾类别覆盖不足这三大痛点,依然困扰着该领域的研究者。 针对这些问题,腾讯混元3D团队在最新技术报告《HY3D-Bench: Generation of 3D Assets》中,正式开源了一套革命性的3D内容生成生态系统。 该工作通过自动化数据清洗流水线,从Objave…
-
三大开源神器:PageLM重塑学习体验,DeepSeek-OCR革新视觉识别,Awesome Web Agents整合AI浏览器生态
PageLM:NotebookLM 的开源替代方案 PageLM 是一款对标 Google NotebookLM 的开源产品。 NotebookLM 的核心功能在于,用户只需上传学习资料,它便能生成播客对话、测验题或复习卡片。PageLM 同样如此,它不仅能够提炼资料重点,更能将静态文本转化为互动式的学习资源。 例如,上传一份历史课件后,PageLM 可以自…
-
Claude Opus 4.6震撼发布:专为长时程Agent任务而生,百万token上下文实现76%检索准确率
凌晨2点,硅谷的两家AI巨头再次展开激烈竞争。由于Claude Opus 4.6发布较早,业界的解读和用户的测试体验也更为丰富。结合Anthropic官方信息及相关测评,Opus 4.6在长上下文信息定位、基于信息的推理能力以及专家级复杂推理方面,表现令人印象深刻。 长期使用Claude的Boris用四个词概括Opus 4.6:更具自主性、更智能、运行时间更…
-
深度解析月之暗面Kimi-K2.5-Thinking:旗舰推理模型在Agent、代码、图像任务上的突破与局限
Kimi-K2.5-Thinking是月之暗面最新发布的旗舰推理模型,被官方称为“Kimi迄今最智能的模型”。该模型在Agent、代码、图像、视频及一系列通用智能任务上取得了开源领域的最佳表现,其核心在于采用了深度思考架构,具备强大的推理能力。 核心结论: 三大亮点: 深度推理能力出色:在数学计算和逻辑推理任务中表现优秀,能够提供详细的推理过程。 中文语义理…
-
OpenClaw狂揽16万star背后:Agent工具的安全困境与火山引擎AgentKit的破局之道
最近,OpenClaw 迅速走红。这个顶着红色龙虾 Logo 的开源 AI 助理,在短短几天内于 GitHub 上斩获了超过 16 万 star。 它就像一个 24X7 在线的超级员工,用户只需通过 WhatsApp、Telegram 等聊天软件发送指令,它就能自动处理邮件、整理日历、浏览网页、管理文件,甚至执行代码或完成复杂任务。 然而,火爆的背后问题也随…
-
2026年开源LLM选型指南:从模型规模到架构实战,打造安全可控的AI应用
到了2026年,关于AI的讨论焦点已经发生了根本性转变。我们早已告别了“聊天机器人演示”的早期阶段。如今,严肃的企业正在构建自己的内部AI解决方案。他们深刻认识到,虽然外部API服务便捷,但公司的核心数据才是最具价值的资产,他们不愿将处理这些数据的关键“大脑”长期租用给外部供应商。 与此同时,技术领域也迎来了一个重大里程碑:开源大语言模型(LLM)的性能已经…
-
Claude Opus 4.6震撼发布:ARC-AGI得分68%创纪录,百万token上下文窗口开启AI新纪元
Anthropic 正式发布了其旗舰模型 Claude Opus 的最新版本 4.6。此次升级带来了显著的智能提升,尤其是在衡量抽象推理能力的 ARC-AGI 2 测试中取得了 68% 的得分,创造了新的纪录,并大幅领先于其他主流模型。 核心能力提升 Opus 4.6 在编程能力上实现了重要进步,能够更细致地规划任务,在大型代码库中进行更可靠的操作,并提升了…
-
英伟达CPO交换机深度解析:突破AI算力瓶颈,引领十亿瓦级AI工厂互联革命
2026年2月3日,英伟达举办了主题为“面向十亿瓦级AI工厂的共封装硅光子(CPO)交换机”的网络研讨会,将CPO技术再次置于AI算力基础设施的核心位置。 此次研讨会并非简单的技术复述,而是英伟达针对AI大模型规模化训练与实时推理的产业痛点,提出的一套“算力-互联”协同升级方案。结合其此前在CES上对Rubin平台中Spectrum以太网交换通过CPO实现S…
-
DualSpeed:革命性双模视觉Token修剪框架,实现MLLM训练4倍加速与99%性能保留
关键词:视觉令牌修剪、多模态大语言模型、高效训练、训练-推理不匹配、双模训练 近年来,多模态大语言模型在图像描述、视觉问答、视觉定位、多模态推理等任务中取得了显著突破,成为人工智能领域的重要研究方向。然而,随着模型规模不断扩大、视觉输入分辨率持续提升,MLLMs 的训练成本急剧上升,成为制约其发展和应用的关键瓶颈。 传统的效率优化方法主要聚焦于模型压缩、参数…
-
奥特曼深度剖析:OpenClaw引领长期趋势,Codex或成OpenAI第三核心产品,揭秘AI时代四大隐形矛盾
近日,OpenAI CEO 山姆·奥特曼(Sam Altman)与思科总裁兼首席产品官 Jeetu Patel 在思科 AI 峰会上进行了一场深度对话。对话中,奥特曼对近期涌现的热门产品、AI 发展的核心矛盾以及 OpenAI 的未来布局发表了见解。 OpenClaw 引领长期趋势,Codex 或成第三核心产品 针对近期备受关注的 OpenClaw 和 Mo…
