距离上代 GPT-Image-1.5 推出近 4 个月后,关于其继任者 GPT-Image-2 的消息开始在海外社区流传。
据悉,OpenAI 近期在大模型竞技场 Chatbot Arena 以多个代号对新一代多模态模型进行了测试,但相关测试目前已经下线。

根据流出的生成示例,该模型在文字渲染能力上表现突出。

信息显示,GPT-Image-2 曾使用「maskingtape-alpha」、「gaffertape-alpha」和「packingtape-alpha」等代号进行测试。除文字渲染外,其在世界知识理解方面的表现也备受关注。

例如,在生成精细的人体解剖学前视图等任务上,模型展现了较强的细节处理能力。

有评论指出,该模型在生成 YouTube 风格图片等复杂场景时,效果已接近真实。


另有观点认为,模型能力已从生成单一对象,转向理解并还原信息密度高的整张网页内容,完成度较高。

据称,GPT-Image-2 有望改善前代模型存在的“黄色滤镜”问题。在图像编辑任务中,其输出结果与原图的偏离程度也得到了显著优化。


在人物肖像生成方面,模型对细节的捕捉能力被认为可用于区分其与前代版本。

目前,GPT-Image-2 已开始向部分 ChatGPT 用户逐步开放测试。

有测试反馈将其与同类模型进行比较,认为其在多个方面具备优势。


评论指出,该模型在图像真实感和文字生成方面表现突出,并期待其与后续竞品的对比。

此外,该模型还被用于低分辨率图像提升、背景干扰元素去除等任务,处理后图像质量有所提升。

模型正式版尚未发布。
关注“鲸栖”小程序,掌握最新AI资讯
本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/archives/28658


