高速推理

大模型推理

GLM-5.1-HighSpeed实测：400 token/s，速度与智商兼得，国产大模型首次突破

GLM-5.1-HighSpeed 正式登场，输出速度达到每秒 400 token。不仅快，而且性能强悍，表现令人惊叹。我第一时间进行了实测，下面直接展示效果。我在 Claude Code 中分别配置了 GLM-5.1 和 GLM-5.1-HighSpeed，先直观感受一下两者的速度差异。 GLM-5.1：发送两个指令后，从发出到收到回复大约需要 31 秒…

8小时前
74000