AI产业动态
-
Kimi-K2.5-Thinking实测:推理效率提升33%,Agent能力意外滑坡,开源模型新标杆?
月之暗面发布了 Kimi-K2.5-Thinking 新版本,官方称其为“Kimi迄今最智能的模型”,在Agent、代码、图像、视频及一系列通用智能任务上取得了开源state-of-the-art表现。我们对新旧两个版本(Kimi-K2.5-Thinking、Kimi-K2-Thinking)进行了全面的对比评测,测试其在准确率、响应时间、token消耗和成…
-
OpenAI掌门人Sam Altman深度分享:AI未来走向、成本曲线与无限智能体内部实践
昨天,OpenAI 首席执行官 Sam Altman 主持了一场线上 AMA 研讨会。在长达一小时的交流中,Sam Altman 对来自现场及线上观众的一系列问题进行了高密度、快节奏的回应。与会者背景多元,涵盖了斯坦福学生创业者、企业 CTO、独立开发者等 OpenAI 生态的重度用户。 Sam Altman 在研讨会上展现了清晰的逻辑与坦诚的态度,不仅分享…
-
太空算力崛起:2026年天地一体化算力网络如何重塑全球竞争格局
第一部分:太空算力发展现状与未来展望 随着算力需求向空天领域延伸,太空算力作为突破地球算力资源边界、构建全球无缝算力网络的重要方向,已进入探索落地的关键阶段。通过卫星星座、太空站算力节点与天地一体化网络,太空算力旨在实现全球覆盖、低时延调度与抗干扰能力的提升,成为全球算力竞争的新焦点。 本节将从技术架构、全球布局、核心企业、挑战与趋势四个维度,系统分析太空算…
-
Vercel发布skills 1.1.1:打破AI助手技能孤岛,构建跨平台共享新生态
Vercel 正式发布了命令行工具 skills 的 1.1.1 版本,该工具旨在解决 AI 助手领域一个长期被忽视的问题:为技能的发现与管理建立一套开放标准。 打破技能孤岛 当前,主流的 AI 编程助手(如 Cursor、Claude Code、GitHub Copilot)都拥有各自独立的技能系统,彼此互不兼容。为其中一个助手开发的技能,无法直接应用于其…
-
11.77亿资本押注卡车新势力「一哥」,L2升维路线率先在商用车跑通!
贾浩楠 发自 凹非寺 量子位 | 公众号 QbitAI 在技术门槛高、商业化挑战大的硬核赛道,总有玩家能够逆周期成长—— 2026年初,自动驾驶赛道迎来首笔重磅投资:卡车新势力DeepWay深向宣布完成总额11.77亿元的Pre-IPO轮融资。 DeepWay深向成立仅5年,却持续获得VC与产业资本青睐,Pre-IPO轮次历经多轮扩充,现已进入冲刺港交所的阶…
-
Attention机制暗藏偏置陷阱:上海大学团队提出去偏修正公式,提升多模态大模型剪枝效率
Attention机制暗藏偏置陷阱:上海大学团队提出去偏修正公式,提升多模态大模型剪枝效率 近年来,视觉-语言模型在多模态理解任务中取得了显著进展。为了降低推理成本,模型通常通过语言到视觉的注意力来衡量视觉标记与文本之间的相关性,并据此进行视觉标记剪枝。 然而,一个长期被忽视的问题是:注意力本身是否真的能够作为“语义重要性”的可靠指标? 上海大学曾丹团队在最…
-
LLM驱动的跨平台内核自动生成:融合监督微调与强化学习的智能优化新范式
关键词:LLM、内核生成、自动化优化、智能体、基准测试 现代人工智能系统的性能从根本上受制于底层内核的质量,这类内核可将高层算法语义转化为底层硬件操作。要实现接近最优性能的内核,需要研发人员具备专家级的硬件架构知识与编程模型认知,这使得内核工程成为一项至关重要但耗时冗长且不具备可扩展性的工作。 Towards Automated Kernel Generat…
-
2026年企业级RAG系统构建指南:8大关键工具避免生产环境陷阱
每个可靠的企业级 RAG 系统背后的 8 个关键工具 我第一次认真构建检索增强生成(RAG)系统时,犯了大多数团队都会犯的同样错误。 我以为 RAG 的核心是选对模型。 其实不是。 企业级 RAG 关注的是模型之外的一切——那些枯燥、脆弱、不光鲜,但决定你的系统能否多年稳定运行、还是在真实流量面前崩塌的部分。 当你越过演示阶段,进入生产环境时,你会发现 RA…
-
RunAnywhere:让大模型在手机端实现完全本地化推理,隐私与性能兼得
今天介绍一个可以在手机本地运行的大模型项目。基于它,开发者成功在iPhone 16 Pro Max上部署了Llama 3.2 3B模型,实现了端到端的本地工具调用。 完全本地化的AI处理 这个项目最大的亮点是所有AI处理都在设备本地完成。LLM推理、工具调用决策、响应解析全部在iPhone上进行,只有在需要外部数据时才调用Foursquare API获取餐厅…
-
COMET框架:突破AI加速器性能瓶颈,显式建模集体通信与复合操作数据流
关键词:复合操作数据流建模、集体通信操作、内存层级优化、机器学习加速器、性能建模与优化 在人工智能技术日新月异的今天,大语言模型、状态空间模型等复杂神经网络已成为推动技术发展的核心引擎。然而,这些模型所依赖的复合操作——即由多个基础操作(如矩阵乘法、归一化、逐元素变换)组合而成的结构化模块——正在对现有的硬件加速器数据流设计与性能优化提出严峻挑战。 传统的数…
