高速推理
-
GLM-5.1-HighSpeed实测:400 token/s,速度与智商兼得,国产大模型首次突破
GLM-5.1-HighSpeed 正式登场,输出速度达到每秒 400 token。不仅快,而且性能强悍,表现令人惊叹。我第一时间进行了实测,下面直接展示效果。 我在 Claude Code 中分别配置了 GLM-5.1 和 GLM-5.1-HighSpeed,先直观感受一下两者的速度差异。 GLM-5.1:发送两个指令后,从发出到收到回复大约需要 31 秒…