HighSpeed

大模型评测

GLM-5.1-HighSpeed实测：400 token/s极速体验，智商速度双杀Claude Opus

400 tokens每秒。这不是实验室里的峰值，而是API对外承诺的稳定输出速度。智谱刚刚放出的GLM-5.1-HighSpeed，直接把大模型推理速度拉到了一个新量级——比普通版GLM-5.1快了近7倍，甚至把Gemini 3.5 Flash甩在了身后。速度翻倍不稀奇，稀奇的是它没有缩水。过去行业里默认的潜规则是：要快，就得用小模型；用小模型，就得接受降…

12小时前
62000