AI推理 - 鲸林向海

1亿美元种子轮！英伟达、AMD、英特尔罕见联手，押注开源推理引擎SGLang背后团队RadixArk

模型层的竞争已进入白热化阶段，而硅谷最核心的半导体掌舵人们，正用真金白银押注一个更为底层的解决方案。一笔1亿美元的种子轮融资，对应着4亿美元的估值，英伟达、AMD、英特尔这三家芯片巨头罕见地同框出现。这笔2026年AI基础设施赛道中最重的早期投资，最终落到了一个从开源社区成长起来的团队——RadixArk，以及其背后的推理引擎SGLang与强化学习框架Mil…

3天前

273000

大模型推理

苹果官方批准TinyGPU驱动：Mac用户现可外接NVIDIA/AMD显卡运行AI推理，无需关闭SIP

关键词：AI、Apple、GPU、硬件、推理、开源专为 AI 设计，游戏玩家再次失望 Apple approves drivers that let AMD and Nvidia eGPUs run on Mac — software designed for AI, though, and not built for gaming https://www…

2026年4月7日

1.5K000

AI产业动态

英伟达发布Vera Rubin NVL72：AI推理拐点已至，算力市场将达万亿美元

北京时间今天凌晨两点，英伟达GTC大会在加州圣何塞正式召开。英伟达联合创始人兼CEO黄仁勋在主题演讲中表示：“我们重新定义了计算，就像个人电脑革命和互联网革命一样。我们现在正处于一个全新平台变革的开端。” 黄仁勋预测，全球公司在Blackwell和Rubin系统上的支出，将在2025年至2027年间达到1万亿美元，其中60%的业务将来自超大规模云计算。这一预…

2026年3月17日

746000

大模型评测

阿里Qwen3.5-27B深度评测：理科思维突出，文档处理与逻辑推理是亮点，艺术创作待提升

阿里近期推出了Qwen3.5-27B模型，作为Qwen3.5系列中的中型主力版本，它定位为一款兼顾高性价比与密集推理需求的开源模型。其实际性能表现如何？以下是本次评测的核心结论。核心结论：三大亮点： OCR与文档理解能力出色：在纯文本提取、复杂表格结构还原及合并单元格识别等任务中表现精准，效果优于部分更大参数的模型。空间逻辑与数学推理能力强：在立体…

2026年3月1日

1.3K000

AI产业动态

阿里千问3.5-Plus重磅开源：原生多模态、性能倒挂、价格屠夫，开源大模型迎来王炸级突破

前阵子，各大模型厂商纷纷迭代产品，功能之多令人眼花缭乱。就在大家以为临近春节，AI圈已无新牌可打时，阿里通义千问却毫无预兆地甩出了一对“王炸”——全新一代大模型 Qwen 3.5-Plus 正式重磅开源。该模型在多模态理解、复杂推理、编程及Agent等核心维度上，不仅全面领先于同级开源模型，更在多项基准测试中足以媲美顶级闭源模型。此次发布的核心亮点如下…

2026年2月16日

686000

大模型推理

推理成本突破1元/百万token：浪潮信息元脑HC1000如何重塑AI产业竞争格局

当前全球AI产业已从模型性能竞赛迈入智能体规模化落地的“生死竞速”阶段，“降本” 不再是可选优化项，而是决定AI企业能否盈利、行业能否突破的核心命脉。在此大背景下，浪潮信息推出元脑HC1000超扩展AI服务器，将推理成本首次击穿至1元/每百万token 。这一突破不仅有望打通智能体产业化落地“最后一公里”的成本障碍，更将重塑AI产业竞争的底层逻辑。浪…

2025年12月26日

460000

开源项目

Kimi K2 Thinking开源引爆AI界：超越GPT-5的300步工具调用模型实战指南

Kimi 最近开源了其思考模型：Kimi K2 Thinking。根据官方介绍，该模型具备“边思考，边使用工具”的能力，能够自主执行高达 300 步的工具调用流程，以解决复杂问题。在被称为“人类终极考试”的高难度推理与通用智力测试中，其表现超越了 GPT-5，达到了当前的最先进水平。若想在 Kimi 官网体验此能力，可直接在 kimi.com 开启“长思考…

2025年11月17日

754000

AI产业动态

AI大模型周报：阿里、腾讯、Anthropic等巨头密集发布，多模态与推理能力成焦点

10月13日【开源】阿里开源 Qwen3-VL-8B-Thinking 与 Qwen3-VL-8B-Instruct 模型。作为 Qwen3-VL 系列的 8B Dense 模型，它们显存占用更低，具备多模态理解与推理能力，支持长视频、长文档等超长上下文输入，并集成了视觉 2D/3D 定位、全面空间感知与万物识别功能。 10月14日【闭源】腾讯混元发…

2025年10月20日

331000