AI推理优化Infra思考模型快 5 倍,就不再是同一个模型Gemini 3.5 Flash 发布会几乎不讲智能,智谱 GLM-5.1 高速版冲到 400 token/s。背后是同一个故事——推理速度跨过 5 倍那条线之后,模型解锁的就是另一类产品了。2026年5月22日6 分钟阅读