AI推理
-
1亿美元种子轮!英伟达、AMD、英特尔罕见联手,押注开源推理引擎SGLang背后团队RadixArk
模型层的竞争已进入白热化阶段,而硅谷最核心的半导体掌舵人们,正用真金白银押注一个更为底层的解决方案。一笔1亿美元的种子轮融资,对应着4亿美元的估值,英伟达、AMD、英特尔这三家芯片巨头罕见地同框出现。这笔2026年AI基础设施赛道中最重的早期投资,最终落到了一个从开源社区成长起来的团队——RadixArk,以及其背后的推理引擎SGLang与强化学习框架Mil…
-
苹果官方批准TinyGPU驱动:Mac用户现可外接NVIDIA/AMD显卡运行AI推理,无需关闭SIP
关键词:AI、Apple、GPU、硬件、推理、开源 专为 AI 设计,游戏玩家再次失望 Apple approves drivers that let AMD and Nvidia eGPUs run on Mac — software designed for AI, though, and not built for gaming https://www…
-
英伟达发布Vera Rubin NVL72:AI推理拐点已至,算力市场将达万亿美元
北京时间今天凌晨两点,英伟达GTC大会在加州圣何塞正式召开。英伟达联合创始人兼CEO黄仁勋在主题演讲中表示:“我们重新定义了计算,就像个人电脑革命和互联网革命一样。我们现在正处于一个全新平台变革的开端。” 黄仁勋预测,全球公司在Blackwell和Rubin系统上的支出,将在2025年至2027年间达到1万亿美元,其中60%的业务将来自超大规模云计算。这一预…
-
阿里Qwen3.5-27B深度评测:理科思维突出,文档处理与逻辑推理是亮点,艺术创作待提升
阿里近期推出了Qwen3.5-27B模型,作为Qwen3.5系列中的中型主力版本,它定位为一款兼顾高性价比与密集推理需求的开源模型。其实际性能表现如何?以下是本次评测的核心结论。 核心结论: 三大亮点: OCR与文档理解能力出色: 在纯文本提取、复杂表格结构还原及合并单元格识别等任务中表现精准,效果优于部分更大参数的模型。 空间逻辑与数学推理能力强: 在立体…
-
阿里千问3.5-Plus重磅开源:原生多模态、性能倒挂、价格屠夫,开源大模型迎来王炸级突破
前阵子,各大模型厂商纷纷迭代产品,功能之多令人眼花缭乱。 就在大家以为临近春节,AI圈已无新牌可打时,阿里通义千问却毫无预兆地甩出了一对“王炸”——全新一代大模型 Qwen 3.5-Plus 正式重磅开源。 该模型在多模态理解、复杂推理、编程及Agent等核心维度上,不仅全面领先于同级开源模型,更在多项基准测试中足以媲美顶级闭源模型。 此次发布的核心亮点如下…
-
推理成本突破1元/百万token:浪潮信息元脑HC1000如何重塑AI产业竞争格局
当前全球AI产业已从模型性能竞赛迈入智能体规模化落地的“生死竞速”阶段,“降本” 不再是可选优化项,而是决定AI企业能否盈利、行业能否突破的核心命脉。 在此大背景下,浪潮信息推出元脑HC1000超扩展AI服务器 ,将推理成本首次击穿至1元/每百万token 。 这一突破不仅有望打通智能体产业化落地“最后一公里”的成本障碍,更将重塑AI产业竞争的底层逻辑。 浪…
-
Kimi K2 Thinking开源引爆AI界:超越GPT-5的300步工具调用模型实战指南
Kimi 最近开源了其思考模型:Kimi K2 Thinking。根据官方介绍,该模型具备“边思考,边使用工具”的能力,能够自主执行高达 300 步的工具调用流程,以解决复杂问题。在被称为“人类终极考试”的高难度推理与通用智力测试中,其表现超越了 GPT-5,达到了当前的最先进水平。 若想在 Kimi 官网体验此能力,可直接在 kimi.com 开启“长思考…
-
AI大模型周报:阿里、腾讯、Anthropic等巨头密集发布,多模态与推理能力成焦点
10月13日 【开源】 阿里开源 Qwen3-VL-8B-Thinking 与 Qwen3-VL-8B-Instruct 模型。作为 Qwen3-VL 系列的 8B Dense 模型,它们显存占用更低,具备多模态理解与推理能力,支持长视频、长文档等超长上下文输入,并集成了视觉 2D/3D 定位、全面空间感知与万物识别功能。 10月14日 【闭源】 腾讯混元发…
