国产模型Speed 3.7 Flash开源：400 TPS速度碾压编程办公，Agent效率革命来了

从“快”到“高效”：2026年，AI模型进入效率革命的新纪元

回顾过去几年国产大模型的能力演进，你会发现一条清晰又耐人寻味的轨迹。

2024年，大家都在拼“极限”。MMLU 刷到了多少分？MATH 能解多难的题？编程能力能不能排进全球前三？那是属于“单点能力军备竞赛”的一年，模型在某个特定领域里越走越深。

2025年，风向骤变。Agent 成为绝对主角。大家不再只看模型能不能答对一道题，而是看它能不能把一件复杂的事做完——长程任务规划、多步执行、工具调度，成了新的“华山论剑”。

而现在，到了2026年，一个新的关键词开始被频繁提及：效率。

国产模型Speed 3.7 Flash开源：400 TPS速度碾压编程办公，Agent效率革命来了

为什么效率变得如此重要？因为现实世界里，一个复杂的Agent任务从你下达指令，到它交付成果，往往需要大几十分钟，甚至数小时。你对着屏幕干等，那种感觉，就像下载进度条卡在99%一样，非常不爽。

正是这种对“等太久”的集体焦虑，催生了 Step 3.7 Flash 的发布与开源。

国产模型Speed 3.7 Flash开源：400 TPS速度碾压编程办公，Agent效率革命来了

这个模型试图撕掉一个旧标签：Flash = 快但笨。它想证明，一个模型完全可以同时做到：速度快、够聪明、成本低。它原生支持多模态，可以高效完成从Coding到办公、搜索等一系列生产级任务。

01 Flash 模型的“聪明”革命：一个真实的开发者体验

很长一段时间里，一提到“Flash”模型，大家的第一反应是：哦，那个又快又便宜的。但“聪明”这个词，似乎总与它无缘。Step 3.7 Flash 的出现，让人感觉这个标签需要被彻底撕掉了。

它并非普通的“快模型”，而是一款为生产级Agent场景专门设计的高效率模型。我把它接入到了我的开源项目 Wechat-ggGitHub/Lumi 中——一个住在你电脑里的AI助手，叫它的名字就能唤醒它干活。

给我这个项目增加一个Step模型的供应商选择，默认使用Step 3.7 Flash模型。整个过程，不到3分钟，这个新功能就开发完成了。

国产模型Speed 3.7 Flash开源：400 TPS速度碾压编程办公，Agent效率革命来了

一次成功，没有报错，丝滑得不像话。我切换到 Step 3.7 Flash 模型后，让我的AI语音助手“钱多多”整理一下桌面，再写一篇关于AI大模型发展史的Word文章。不到一分钟，两个任务全部完成，高效且保证了效果。如果是其他模型，光是理解“整理桌面”这个模糊指令，可能就得反复确认好几分钟。

02 四大核心亮点：为什么它改写了“效率”的定义

接下来，我们具体拆解一下，Step 3.7 Flash 到底有哪些颠覆性的亮点。

① Agent 效率：不只关注“跑得快”，更关注“跑得通”

这是最核心的一点，也最容易产生误解。生产级Agent任务不是一次问答，它是一个包含规划、推理、搜索、工具调用、代码生成、多模态理解、反复修正的完整链路。

单次模型调用的速度再快，如果它在Agent Loop（循环）里频繁“卡壳”或“跑偏”，整体效率依然很低。真正的价值，体现在Agent每一次循环里的决策质量。

国产模型Speed 3.7 Flash开源：400 TPS速度碾压编程办公，Agent效率革命来了

看看上面的Agent相关评测榜单。在那些干复杂脏活累活的Agent任务上，这个速度很快的模型，有底气跟国际上最顶尖、最昂贵的模型掰掰手腕。它证明了：在复杂逻辑链路里，稳定且快速的输出，比单纯在某个Benchmark上刷高分更有实际意义。

② 原生多模态：视觉理解不再是“外挂”，而是“本能”

多模态能力是Step 3.7 Flash的原生组成部分，而不是后期拼凑上去的功能。

直接看一个例子：我让它把我桌面的发票图片，提取关键信息并整理到一个表格里。仅仅20秒，它完成了10张发票图片的OCR信息提取 + 表格录入。又快，效率又高。

这意味着，你不再需要额外编排一个视觉模块来处理截图、文档或界面截图。模型本身就能理解视觉内容，并且将这个能力无缝嵌入到Agent的执行流程中。当Agent能直接“看懂”世界时，它能处理的场景边界被大大拓宽了。

③ Search：从“独立工具”到“思考的延伸”

在传统的AI工作流里，搜索往往是一个独立步骤：Agent需要信息时，调用一个搜索工具，然后把搜索结果喂回模型。

Step 3.7 Flash 对搜索能力进行了重点升级，让搜索更像是Agent思考与行动的自然延伸。它不是一个“打断思考”的外部动作，而是“思考过程”的一部分。

Agent可以更高效地获取上下文、理解信息、验证结果，并基于更及时的信息完成任务。在真实任务中，一轮对话里可能需要多次搜索，每次搜索都要快、要准、要少占用上下文窗口。Step 3.7 Flash 的搜索效率，直接影响Agent的决策质量和响应速度。

④ 还是开源的

最后，也是很重要的一点：Step 3.7 Flash 是一款开源模型。这意味着你可以把它部署在自己的基础设施上运行，数据不离开你的环境，这对于追求数据安全的企业来说，价值巨大。

国产模型Speed 3.7 Flash开源：400 TPS速度碾压编程办公，Agent效率革命来了

开源地址：https://github.com/stepfun-ai/Step-3.7-Flash

03 如何上手：个人也能用的高效模型

好消息是，这个高效的模型，个人开发者也能轻松使用。你可以接入到你的 Claude Code、OpenClaw 等 Agent 工具中。Step Plan 就支持这种接入方式。

国产模型Speed 3.7 Flash开源：400 TPS速度碾压编程办公，Agent效率革命来了

下面是接入使用的相关指引，感兴趣的话可以去看看：

接入 step-3.7-flash：https://platform.stepfun.com/docs/zh/guides/models/step-3.7-flash
Step Plan 订阅：https://platform.stepfun.com/step-plan
Step Plan 接入：https://platform.stepfun.com/docs/zh/step-plan/quick-start

写在最后

2026年的AI模型竞赛，不再是单纯的“谁算得更快”或“谁答得更准”。真正的战场，转移到了“谁能用最低的成本、最快的速度，完成最复杂的真实任务”。

Step 3.7 Flash 的开源，或许标志着我们正式进入了“效率为王”的新纪元。对于开发者而言，这意味着我们可以把更多精力放在定义“做什么”上，而不再需要为“怎么做”和“等多久”而焦虑。这，才是真正的生产力解放。

关注“鲸栖”小程序，掌握最新AI资讯

本文来自网络搜集，不代表鲸林向海立场，如有侵权，联系删除。转载请注明出处：https://www.itsolotime.com/archives/37056

国产模型Speed 3.7 Flash开源：400 TPS速度碾压编程办公，Agent效率革命来了

从“快”到“高效”：2026年，AI模型进入效率革命的新纪元

01 Flash 模型的“聪明”革命：一个真实的开发者体验

02 四大核心亮点：为什么它改写了“效率”的定义

① Agent 效率：不只关注“跑得快”，更关注“跑得通”

② 原生多模态：视觉理解不再是“外挂”，而是“本能”

③ Search：从“独立工具”到“思考的延伸”

④ 还是开源的

03 如何上手：个人也能用的高效模型

相关推荐

AI自我进化加速：60%概率2028实现递归自改进，OpenAI重金招聘

Qwen3.7-Plus发布：多模态智能体终结对话AI，从看懂到干完

MiniMax M3震撼发布：首个集齐Coding、百万上下文、多模态三件套的开源模型

Anthropic秘密递交S-1招股书，估值逼近万亿美元，AI御三家冲刺IPO

Anthropic开源杀手级插件：Claude Cowork插件库已17K星，办公岗位全覆盖