GPT-5.1

GPT-5.1-medium深度评测：思考模式性能飙升，但成本激增175%引关注

OpenAI近期发布了GPT-5.1系列新版本，其中GPT-5.1-medium作为思考模式（thinking）的代表产品，在性能上实现了显著提升。官方强调该系列“在简单任务上反应更快，在复杂任务上思考更久”，并优化了对话自然度和情感共鸣。我们对GPT-5.1-medium与此前的GPT-5进行了全面对比评测，测试其在准确率、响应时间、token消耗和成本等…

2025年11月21日

175000

大模型评测

GPT-5.1性能评测：准确率骤降11.3%，OpenAI的“情绪价值”战略代价几何？

OpenAI近期发布了GPT-5.1新版本，主打更自然的对话体验和情感共鸣能力。值得注意的是，官方此次并未公布传统基准测试结果，而是强调“优秀的人工智能不仅应该是聪明的，而且应该提供令人愉快的交谈”。我们对GPT-5.1（默认非思考模式）与此前的GPT-5进行了全面对比评测，测试其在准确率、响应时间、token消耗和成本等关键指标上的表现差异。 GPT-5.…

2025年11月20日

161000

AI产业动态

GPT-5.1悄然上线：自适应推理与人格化交互如何重塑AI对话体验

近日，OpenAI在未进行大规模宣传的情况下，向部分付费用户推送了GPT-5.1版本。这一更新并非简单的迭代，而是通过引入“即时思考”（GPT-5.1 Instant）与“深度思考”（GPT-5.1 Thinking）双模式架构，重新定义了AI对话系统的响应机制。新版本的核心创新在于其自适应推理能力——系统能够根据查询的复杂程度自动匹配至合适的处理模式，从而…

2025年11月13日

173000