模型优化 - 鲸林向海

GPT-5.4 mini发布即遭质疑：性能仅排第13，价格却涨三倍

GPT-5.4 mini 发布即遭质疑：性能仅排第13，价格却涨三倍 OpenAI 最新推出的 GPT-5.4 mini 模型，在发布首日便面临诸多质疑。根据公开的大语言模型评测基准 Vals 数据显示，新发布的 GPT-5.4 mini 仅排名第 13 位，其性能优于 OpenAI 半年前发布的 GPT-5。值得注意的是，排名第 12 位的是于一月底…

1天前

92000

AI产业动态

OpenAI GPT-5.3 Instant重磅发布：情商更高、废话更少，终于学会像正常人一样聊天

OpenAI 发布 GPT-5.3 Instant：沟通更自然，响应更直接 3月4日，OpenAI 正式发布了 GPT-5.3 Instant 模型。作为速度优化版本，该模型适合快速日常查询、草稿写作、即时翻译等轻量任务。此次更新的核心目标是优化模型的沟通体验。OpenAI 官方表示，新模型旨在减少以往对话中可能出现的“尴尬感”和机械式回复。我们已经清楚…

2026年3月4日

113000

大模型推理

微软Re-TRAC框架：让AI智能体记住失败经验，4B模型性能超越大模型

想象一下，你让 AI 助手结合搜索工具探索一个复杂问题。它第一次探索时走错了方向，但第二次、第三次，它依然重复同样的错误探索路径。虽然你可能可以从最终得到的多次探索结果中挑选出一个勉强满意的答案，但是这既低效，也需要人工干预。这就是当前大多数深度搜索智能体面临的困境——它们无法「记住」之前的探索经验，每次都是从头开始，导致大量冗余搜索和资源浪费。现有的深度…

2026年2月19日

92000

AI产业动态

OpenAI掌门人Sam Altman深度分享：AI未来走向、成本曲线与无限智能体内部实践

昨天，OpenAI 首席执行官 Sam Altman 主持了一场线上 AMA 研讨会。在长达一小时的交流中，Sam Altman 对来自现场及线上观众的一系列问题进行了高密度、快节奏的回应。与会者背景多元，涵盖了斯坦福学生创业者、企业 CTO、独立开发者等 OpenAI 生态的重度用户。 Sam Altman 在研讨会上展现了清晰的逻辑与坦诚的态度，不仅分享…

2026年1月28日

178000

AI产业动态

Google Gemini模型矩阵再添新军：Nano Banana 2 Flash与Gemini 3.0 Flash的战略布局与技术解析

近期，Google在AI模型领域的动态再次引发行业关注。继Nano Banana 2 Pro（内部代号Ketchup）之后，代码库中出现的“Mayo”指向了即将发布的Nano Banana 2 Flash版本。这一系列动作不仅揭示了Google在模型优化上的持续投入，更展现了其通过分层策略扩大Gemini生态系统覆盖范围的战略意图。从技术架构来看，Nano…

2025年12月8日

231000