GPT-Image-2泄露:OpenAI新一代图像模型震撼亮相,文字渲染与知识理解全面超越前代

距离上代 GPT-Image-1.5 推出近 4 个月后,关于其继任者 GPT-Image-2 的消息开始在海外社区流传。

据悉,OpenAI 近期在大模型竞技场 Chatbot Arena 以多个代号对新一代多模态模型进行了测试,但相关测试目前已经下线。

GPT-Image-2泄露:OpenAI新一代图像模型震撼亮相,文字渲染与知识理解全面超越前代

根据流出的生成示例,该模型在文字渲染能力上表现突出。

GPT-Image-2泄露:OpenAI新一代图像模型震撼亮相,文字渲染与知识理解全面超越前代

信息显示,GPT-Image-2 曾使用「maskingtape-alpha」、「gaffertape-alpha」和「packingtape-alpha」等代号进行测试。除文字渲染外,其在世界知识理解方面的表现也备受关注。

GPT-Image-2泄露:OpenAI新一代图像模型震撼亮相,文字渲染与知识理解全面超越前代

例如,在生成精细的人体解剖学前视图等任务上,模型展现了较强的细节处理能力。

GPT-Image-2泄露:OpenAI新一代图像模型震撼亮相,文字渲染与知识理解全面超越前代

有评论指出,该模型在生成 YouTube 风格图片等复杂场景时,效果已接近真实。

GPT-Image-2泄露:OpenAI新一代图像模型震撼亮相,文字渲染与知识理解全面超越前代
GPT-Image-2泄露:OpenAI新一代图像模型震撼亮相,文字渲染与知识理解全面超越前代

另有观点认为,模型能力已从生成单一对象,转向理解并还原信息密度高的整张网页内容,完成度较高。

GPT-Image-2泄露:OpenAI新一代图像模型震撼亮相,文字渲染与知识理解全面超越前代

据称,GPT-Image-2 有望改善前代模型存在的“黄色滤镜”问题。在图像编辑任务中,其输出结果与原图的偏离程度也得到了显著优化。

GPT-Image-2泄露:OpenAI新一代图像模型震撼亮相,文字渲染与知识理解全面超越前代

GPT-Image-2泄露:OpenAI新一代图像模型震撼亮相,文字渲染与知识理解全面超越前代

在人物肖像生成方面,模型对细节的捕捉能力被认为可用于区分其与前代版本。

GPT-Image-2泄露:OpenAI新一代图像模型震撼亮相,文字渲染与知识理解全面超越前代

目前,GPT-Image-2 已开始向部分 ChatGPT 用户逐步开放测试。

GPT-Image-2泄露:OpenAI新一代图像模型震撼亮相,文字渲染与知识理解全面超越前代

有测试反馈将其与同类模型进行比较,认为其在多个方面具备优势。

GPT-Image-2泄露:OpenAI新一代图像模型震撼亮相,文字渲染与知识理解全面超越前代

GPT-Image-2泄露:OpenAI新一代图像模型震撼亮相,文字渲染与知识理解全面超越前代

评论指出,该模型在图像真实感和文字生成方面表现突出,并期待其与后续竞品的对比。

GPT-Image-2泄露:OpenAI新一代图像模型震撼亮相,文字渲染与知识理解全面超越前代

此外,该模型还被用于低分辨率图像提升、背景干扰元素去除等任务,处理后图像质量有所提升。

GPT-Image-2泄露:OpenAI新一代图像模型震撼亮相,文字渲染与知识理解全面超越前代

模型正式版尚未发布。


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/archives/28658

(0)
上一篇 4小时前
下一篇 4小时前

相关推荐

  • Kimi-K2.5-Thinking实测:推理效率提升33%,Agent能力意外滑坡,开源模型新标杆?

    月之暗面发布了 Kimi-K2.5-Thinking 新版本,官方称其为“Kimi迄今最智能的模型”,在Agent、代码、图像、视频及一系列通用智能任务上取得了开源state-of-the-art表现。我们对新旧两个版本(Kimi-K2.5-Thinking、Kimi-K2-Thinking)进行了全面的对比评测,测试其在准确率、响应时间、token消耗和成…

    2026年1月28日
    1.2K00
  • 千P级智算中心建设方案:AI大模型时代的算力基石

    一、算力中心建设方案 (一) 建设规模 AI大模型时代已经来临,人工智能技术的创新与变革催生出几何级增长的算力需求。据OpenAI数据显示,算力需求每3至4个月便需翻倍。大模型虽增强了AI技术的通用性,助力行业AI普惠化,但其参数量已攀升至数千亿级别,训练数据集规模亦高达TB级别。通常,完成单个大模型的训练即需投入超过200 PFlops的智能算力资源。综合…

    2026年1月29日
    33600
  • 信息论视角下的思考革命:Adaptive Think如何终结大模型的过度推理困境

    在人工智能领域,大模型的推理能力已成为衡量技术进步的关键指标。从OpenAI的o1系列到DeepSeek的R1,再到QwQ等强化学习推理模型,这些系统通过生成冗长的推理链条(Chain-of-Thought,CoT),在数学、逻辑和常识推理任务中展现出令人瞩目的多步推理能力。然而,中国人民大学、腾讯Jarvis Lab和西湖大学的研究团队通过深入分析发现,当…

    2025年12月19日
    25200
  • UML之父怒怼AI淘汰论:软件工程迎来第三次黄金时代,AI只是更高层级的抽象

    近日,关于“互联网已死”、“SaaS 已被 AI 扼杀”的论调,伴随着各类新奇的 Agentic 产品发布以及部分 AI 领域意见领袖“代码已不值钱”的言论,再次甚嚣尘上。 事实果真如此吗?答案显然是否定的。 多位知名的投资人及企业家迅速予以反驳。例如,a16z 的知名投资人 Jutine Moore 便在社交媒体上调侃“SaaS 已死”的论调过于天真: “…

    2026年2月10日
    26900
  • 摩尔线程LiteGS斩获SIGGRAPH Asia银奖:3D高斯溅射技术突破60秒高质量重建极限

    在近期于香港举办的SIGGRAPH Asia 2025国际图形学顶级学术会议上,摩尔线程凭借其自主研发的3D高斯溅射(3DGS)基础库LiteGS,在3DGS重建挑战赛中荣获银奖。这一成就不仅展示了摩尔线程在算法创新与软硬件协同优化方面的深厚实力,也标志着该公司在新一代图形渲染技术领域获得了学术界的高度认可。 3D高斯溅射作为2023年提出的革命性三维场景表…

    2025年12月17日
    33700