GPT-Image-2泄露:OpenAI新一代图像模型震撼亮相,文字渲染与知识理解全面超越前代

距离上代 GPT-Image-1.5 推出近 4 个月后,关于其继任者 GPT-Image-2 的消息开始在海外社区流传。

据悉,OpenAI 近期在大模型竞技场 Chatbot Arena 以多个代号对新一代多模态模型进行了测试,但相关测试目前已经下线。

GPT-Image-2泄露:OpenAI新一代图像模型震撼亮相,文字渲染与知识理解全面超越前代

根据流出的生成示例,该模型在文字渲染能力上表现突出。

GPT-Image-2泄露:OpenAI新一代图像模型震撼亮相,文字渲染与知识理解全面超越前代

信息显示,GPT-Image-2 曾使用「maskingtape-alpha」、「gaffertape-alpha」和「packingtape-alpha」等代号进行测试。除文字渲染外,其在世界知识理解方面的表现也备受关注。

GPT-Image-2泄露:OpenAI新一代图像模型震撼亮相,文字渲染与知识理解全面超越前代

例如,在生成精细的人体解剖学前视图等任务上,模型展现了较强的细节处理能力。

GPT-Image-2泄露:OpenAI新一代图像模型震撼亮相,文字渲染与知识理解全面超越前代

有评论指出,该模型在生成 YouTube 风格图片等复杂场景时,效果已接近真实。

GPT-Image-2泄露:OpenAI新一代图像模型震撼亮相,文字渲染与知识理解全面超越前代
GPT-Image-2泄露:OpenAI新一代图像模型震撼亮相,文字渲染与知识理解全面超越前代

另有观点认为,模型能力已从生成单一对象,转向理解并还原信息密度高的整张网页内容,完成度较高。

GPT-Image-2泄露:OpenAI新一代图像模型震撼亮相,文字渲染与知识理解全面超越前代

据称,GPT-Image-2 有望改善前代模型存在的“黄色滤镜”问题。在图像编辑任务中,其输出结果与原图的偏离程度也得到了显著优化。

GPT-Image-2泄露:OpenAI新一代图像模型震撼亮相,文字渲染与知识理解全面超越前代

GPT-Image-2泄露:OpenAI新一代图像模型震撼亮相,文字渲染与知识理解全面超越前代

在人物肖像生成方面,模型对细节的捕捉能力被认为可用于区分其与前代版本。

GPT-Image-2泄露:OpenAI新一代图像模型震撼亮相,文字渲染与知识理解全面超越前代

目前,GPT-Image-2 已开始向部分 ChatGPT 用户逐步开放测试。

GPT-Image-2泄露:OpenAI新一代图像模型震撼亮相,文字渲染与知识理解全面超越前代

有测试反馈将其与同类模型进行比较,认为其在多个方面具备优势。

GPT-Image-2泄露:OpenAI新一代图像模型震撼亮相,文字渲染与知识理解全面超越前代

GPT-Image-2泄露:OpenAI新一代图像模型震撼亮相,文字渲染与知识理解全面超越前代

评论指出,该模型在图像真实感和文字生成方面表现突出,并期待其与后续竞品的对比。

GPT-Image-2泄露:OpenAI新一代图像模型震撼亮相,文字渲染与知识理解全面超越前代

此外,该模型还被用于低分辨率图像提升、背景干扰元素去除等任务,处理后图像质量有所提升。

GPT-Image-2泄露:OpenAI新一代图像模型震撼亮相,文字渲染与知识理解全面超越前代

模型正式版尚未发布。


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/archives/28658

(0)
上一篇 2026年4月5日 下午6:46
下一篇 2026年4月5日 下午6:52

相关推荐

  • LabOS:AI协研科学家如何重塑实验室——从计算推理到物理操作的科学革命

    在传统科研范式面临效率瓶颈的当下,一个融合人工智能、扩展现实与机器人技术的智能实验室操作系统LabOS,正悄然开启人类与机器智能协同进化的科学发现新时代。这一由斯坦福大学丛乐教授、普林斯顿大学王梦迪教授团队与英伟达联合研发的系统,首次实现了从假说生成到实验验证的端到端闭环,标志着AI从纯数字世界的“理论家”向具备“眼-脑-手”协同能力的物理实验参与者的历史性…

    2025年11月20日
    45900
  • Anthropic逆天狂飙:美国市场份额70%、年化收入200亿美元,Claude全面碾压OpenAI

    Anthropic的市场表现引发了广泛关注。数据显示,截至2026年2月,其在美国AI市场的份额已迅速增长至近70%,实现了对OpenAI的反超。 在约一年时间内,ChatGPT原本占据主导的市场份额,大部分已被Claude系列产品所获取。 更引人注目的是其财务表现。据报道,Anthropic的年化收入(ARR)已接近200亿美元,并在两周内增长了约50亿美…

    2026年3月5日
    85500
  • Claude深夜全线宕机10小时!AWS数据中心遭不明物体袭击,全球打工人集体断粮

    新智元报道编辑:桃子 好困 【新智元导读】 深夜,Claude突发全球性大规模宕机,引发用户广泛讨论。与此同时,美国财政部宣布全面停用Claude。硅谷数百名CEO与行业领袖联名发起行动,声援Anthropic。 全球Claude用户的心态,在那一刻彻底崩了。一场突如其来的全球性宕机,瞬间引爆网络。 此前,一场抵制ChatGPT、转投Claude的运动在全球…

    2026年3月3日
    86700
  • INTELLECT-3:开源RL技术栈引领大规模强化学习新范式

    近日,Prime Intellect正式发布了INTELLECT-3模型,这是一款拥有106B参数的混合专家(Mixture-of-Experts)架构模型,基于其自研的强化学习技术栈进行训练。该模型在数学、代码、科学和推理等多个基准测试中取得了同规模模型中的最佳表现,甚至超越了部分参数更大的前沿模型。更重要的是,Prime Intellect将完整的训练流…

    2025年12月10日
    42600
  • AionUi:本地开源AI协作平台,图形化整合Claude Code、Gemini CLI等多模型命令行工具

    AionUi 在 GitHub 上已经获得 12K 的 Star。 它是一个本地、免费、开源的 AI 协作平台,对标 Anthropic 的 Cowork,但完全本地可部署、免费开源。 AionUi 并非简单的浏览器聊天界面,而是一个系统级的 AI 协作工具。 其核心是为 Claude Code、Gemini CLI 等命令行 AI 智能体提供了一层统一的图…

    2026年2月7日
    88900