模型优化 - 鲸林向海

开源项目

GEMS：让6B小模型超越Nano Banana 2！多模态生成新范式，Agent+记忆+技能三合一

GEMS：Agent-Native Multimodal Generation with Memory and Skills 当前的多模态生成模型虽然在主流任务上表现出色，但在处理复杂指令和下游任务时仍有不足。近期，先进的智能体（Agent）框架（如OpenClaw、Claude Code）在复杂真实任务中展现出强大能力。受此启发，上海人工智能实验室联合南…

2026年4月11日

271000

大模型工程

MiniMax M2.7重磅更新：10B参数模型如何实现Agent自主进化，在MLE竞赛中斩获9枚金牌？

年后，AI领域的更新浪潮持续高涨。在众多模型密集发布之际，MiniMax也迎来了其重要的版本迭代——全新的旗舰模型M2.7正式发布。本次更新不仅涵盖了模型基础能力的增强，更引入了一项核心创新：Agent Harness。该机制旨在实现Agent的自主优化，其核心模块包括短时记忆、自反馈与自优化。官方文档中“开启模型的自我进化”的描述，揭示了此次更新更深层…

2026年3月21日

827000

AI产业动态

GPT-5.4 mini发布即遭质疑：性能仅排第13，价格却涨三倍

GPT-5.4 mini 发布即遭质疑：性能仅排第13，价格却涨三倍 OpenAI 最新推出的 GPT-5.4 mini 模型，在发布首日便面临诸多质疑。根据公开的大语言模型评测基准 Vals 数据显示，新发布的 GPT-5.4 mini 仅排名第 13 位，其性能优于 OpenAI 半年前发布的 GPT-5。值得注意的是，排名第 12 位的是于一月底…

2026年3月18日

787000

AI产业动态

OpenAI GPT-5.3 Instant重磅发布：情商更高、废话更少，终于学会像正常人一样聊天

OpenAI 发布 GPT-5.3 Instant：沟通更自然，响应更直接 3月4日，OpenAI 正式发布了 GPT-5.3 Instant 模型。作为速度优化版本，该模型适合快速日常查询、草稿写作、即时翻译等轻量任务。此次更新的核心目标是优化模型的沟通体验。OpenAI 官方表示，新模型旨在减少以往对话中可能出现的“尴尬感”和机械式回复。我们已经清楚…

2026年3月4日

331000

大模型推理

微软Re-TRAC框架：让AI智能体记住失败经验，4B模型性能超越大模型

想象一下，你让 AI 助手结合搜索工具探索一个复杂问题。它第一次探索时走错了方向，但第二次、第三次，它依然重复同样的错误探索路径。虽然你可能可以从最终得到的多次探索结果中挑选出一个勉强满意的答案，但是这既低效，也需要人工干预。这就是当前大多数深度搜索智能体面临的困境——它们无法「记住」之前的探索经验，每次都是从头开始，导致大量冗余搜索和资源浪费。现有的深度…

2026年2月19日

281000

AI产业动态

OpenAI掌门人Sam Altman深度分享：AI未来走向、成本曲线与无限智能体内部实践

昨天，OpenAI 首席执行官 Sam Altman 主持了一场线上 AMA 研讨会。在长达一小时的交流中，Sam Altman 对来自现场及线上观众的一系列问题进行了高密度、快节奏的回应。与会者背景多元，涵盖了斯坦福学生创业者、企业 CTO、独立开发者等 OpenAI 生态的重度用户。 Sam Altman 在研讨会上展现了清晰的逻辑与坦诚的态度，不仅分享…

2026年1月28日

431000

AI产业动态

Google Gemini模型矩阵再添新军：Nano Banana 2 Flash与Gemini 3.0 Flash的战略布局与技术解析

近期，Google在AI模型领域的动态再次引发行业关注。继Nano Banana 2 Pro（内部代号Ketchup）之后，代码库中出现的“Mayo”指向了即将发布的Nano Banana 2 Flash版本。这一系列动作不仅揭示了Google在模型优化上的持续投入，更展现了其通过分层策略扩大Gemini生态系统覆盖范围的战略意图。从技术架构来看，Nano…

2025年12月8日

388000