HighSpeed
-
GLM-5.1-HighSpeed实测:400 token/s极速体验,智商速度双杀Claude Opus
400 tokens每秒。这不是实验室里的峰值,而是API对外承诺的稳定输出速度。智谱刚刚放出的GLM-5.1-HighSpeed,直接把大模型推理速度拉到了一个新量级——比普通版GLM-5.1快了近7倍,甚至把Gemini 3.5 Flash甩在了身后。 速度翻倍不稀奇,稀奇的是它没有缩水。过去行业里默认的潜规则是:要快,就得用小模型;用小模型,就得接受降…