GPT Image 2即将发布:LMArena泄露揭示了什么?(2026)

Nanobanana2 TeamApril 4, 2026

OpenAI的下一代图像生成模型——GPT Image 2——似乎已经在野外被发现。三个神秘模型以maskingtape-alpha、gaffertape-alpha和packingtape-alpha的代号出现在LMArena上,其图像质量令测试者震惊,随后被悄然移除。以下是我们目前所知的关于GPT Image 2的一切、它对AI图像生成领域的意义,以及你何时能用上它。

核心要点

  • 三个未公开模型在LMArena上自称来自OpenAI,性能远超当前的GPT Image 1(nano-banana-2)
  • 用户报告在写实游戏截图、自然摄影和原创生物设计方面取得突破性质量
  • 三个模型在被发现后不久即从LMArena移除——这种模式通常预示着即将正式发布
  • 基于OpenAI的发布节奏,GPT Image 2最早可能在2026年第二季度到来

GPT Image 2是什么?

GPT Image 2是OpenAI当前图像生成模型GPT Image 1(在LMArena上的内部代号为nano-banana)的预期继任者。GPT Image 1已经以1264的ELO分数和87%的写实准确率领跑LM Arena图像排行榜。GPT Image 2似乎将这些能力大幅推进。

当前的GPT Image 1为ChatGPT中的图像生成提供支持,并通过OpenAI API以gpt-image-1的模型ID提供调用。它在2025年初取代了DALL-E 3,迅速成为使用最广泛的AI图像生成器。GPT Image 2将代表下一个重大飞跃。

GPT Image 2是如何在LMArena上被发现的?

LMArena(前身为Chatbot Arena)定期匿名测试未发布的模型。2026年4月初,三个新的图像模型以以下代号出现:

  • maskingtape-alpha
  • gaffertape-alpha
  • packingtape-alpha

当用户要求这些模型自我识别时,它们声称来自OpenAI。这种命名模式(胶带主题代号)与现有的nano-banana系列不同,表明这是新一代模型而非增量更新。

Reddit的r/singularity社区引起关注后数小时内,三个模型均从LMArena移除。这种移除模式与之前OpenAI模型的发布如出一辙——GPT Image 1在正式发布前也曾从匿名测试中被撤下。

GPT Image 2能做什么?

根据模型被移除前的社区测试,GPT Image 2在多个类别中展现了卓越能力:

写实游戏截图

GPT Image 2最引人注目的特性是其生成几乎与真实游戏画面无法区分的游戏截图的能力。测试者生成了来自Minecraft、赛博朋克2077、GTA、骑马与砍杀:战团和行星边际2的逼真截图——包括UI元素、HUD覆盖层,甚至游戏内聊天框中引用了真实的玩家名和服务器IP。

一位测试者描述Minecraft的生成结果让他"仿佛回到了2012年",因为服务器突袭场景看起来太过真实。使用的提示词为:"Screenshot from Minecraft, with the player participating in a factions server raid. The player is part of the raiding party, overlooking a large TNT cannon attacking a base."

GPT Image 2 (maskingtape-alpha) 生成的Minecraft服务器突袭截图——几乎与真实游戏画面无法区分 GPT Image 2输出(maskingtape-alpha):Minecraft服务器突袭截图。聊天框中引用了真实玩家名和服务器IP。来源:Reddit r/singularity

作为对比,以下是相同提示词在Nano Banana 2(GPT Image 1)上的输出:

相同Minecraft提示词在Nano Banana 2 (GPT Image 1) 上的输出——明显不够逼真 Nano Banana 2(GPT Image 1)使用相同提示词的输出——质量差距一目了然。来源:Reddit r/singularity

另一个突出的例子:maskingtape-alpha生成的**"GTA Hong Kong 2075"**,产出了一个宛如游戏预告片泄露的电影级开放世界场景。

maskingtape-alpha生成的GTA Hong Kong 2075——看起来像真实的游戏预告片 GPT Image 2输出(maskingtape-alpha):"GTA Hong Kong 2075"——光影效果、UI元素和城市环境极其逼真。来源:Reddit r/singularity

虚构游戏画面

GPT Image 2还擅长生成不存在的游戏截图。一个关于*"a screenshot showing gameplay footage of a first person view werewolf AAA game, made with a proprietary game engine, dark gothic visual theme, mid-gameplay UI and footage"*的提示词产出了看起来像是一款精心制作的未发布游戏的真实画面。

packingtape-alpha生成的狼人AAA游戏截图——一款不存在的游戏 GPT Image 2输出(packingtape-alpha):一款不存在的第一人称狼人游戏——却看起来像真正的AAA大作。有评论者表示画面"让我想起了Witchfire"。来源:Reddit r/singularity

另一位用户分享了一个让他感叹的结果:"First time I've seen an image model succeed on this(第一次看到图像模型在这个上面成功)。" 该模型处理了一个以往所有AI图像生成器都无法完成的高难度提示词:

GPT Image 2成功完成了此前所有图像模型都失败的提示词 GPT Image 2:成功完成了一个此前所有模型都失败的提示词。来源:Reddit r/singularity

自然摄影

在使用"国家地理风格的秃鹫攻击水中蟒蛇的自然照片"提示词进行的并排对比中,三个GPT Image 2变体都产出了比nano-banana-2(GPT Image 1)更加逼真且构图更加精致的结果。

原创生物设计

当被要求*"design a completely original creature that could exist in a real ecosystem"*(设计一种可以存在于真实生态系统中的全新生物)时,GPT Image 2生成了具有连贯解剖细节的生物学上合理的有机体——这是之前的模型通常只能产出奇幻风格结果的任务。

GPT Image 2设计的原创生物——生物学上合理,解剖结构连贯 GPT Image 2输出:一种设计为可在真实生态系统中生存的原创生物——注意其连贯的解剖结构和逼真的纹理。来源:Reddit r/singularity

对比相同提示词在Nano Banana Pro(GPT Image 1)上的输出:

相同生物设计提示词在Nano Banana Pro (GPT Image 1) 上的输出——更偏奇幻风格,生物学合理性较低 Nano Banana Pro(GPT Image 1)使用相同提示词的输出——结果更偏奇幻风格,生物学合理性较低。来源:Reddit r/singularity

已知局限

该模型的内部"世界模型"仍存在不足。物理模拟并不总是准确的——Minecraft场景中TNT大炮的弹道不符合物理逻辑,地图细节在放大后会出现问题。生成图像中的文字和信息准确性仍不完美,尽管相比GPT Image 1有明显改善。

GPT Image 2与GPT Image 1有何不同?

特性GPT Image 1(当前)GPT Image 2(泄露)
LMArena代号nano-banana-2maskingtape/gaffertape/packingtape-alpha
写实度87%准确率显著提升(确切分数待定)
游戏截图质量可识别但有瑕疵几乎与真实游戏画面无法区分
复杂场景构图良好大幅改善
世界模型/物理基础改善但仍不完美
文字渲染良好预期改善(测试有限)
API模型IDgpt-image-1待定(可能为gpt-image-2)

从GPT Image 1到GPT Image 2的跨越,似乎堪比从DALL-E 3到GPT Image 1的飞跃——这是代际级的进步而非增量优化。

GPT Image 2与Midjourney V7如何比较?

Midjourney V7目前在LMArena上的ELO分数约为1200,仍是艺术连贯性和美学质量的标杆。基于GPT Image 2的早期测试:

  • 写实性:GPT Image 2似乎进一步拉大了对Midjourney V7的领先优势
  • 艺术风格:Midjourney V7在创意和编辑工作方面可能仍保持优势
  • 游戏/UI生成:GPT Image 2占据主导地位——在合成截图生成方面无人能及
  • 提示词理解:GPT Image 2继承了OpenAI的语言模型骨架,提供更优的指令理解能力

如需了解当前一代模型的详细对比,请参阅我们的GPT Image 1.5 vs Midjourney V7完整指南

GPT Image 2何时发布?

目前尚无官方发布日期,但多个信号指向GPT Image 2即将推出:

  1. LMArena移除模式:从匿名测试中撤下的模型通常在2-4周内发布
  2. 三个变体测试:测试多个模型变体表明OpenAI正在确定最终发布版本
  3. OpenAI的2026路线图:OpenAI一直在加速发布节奏,GPT-5已在2026年初推出,多模态能力持续扩展
  4. 竞争压力:Google的Imagen 3和Midjourney V7已缩小差距——OpenAI需要强有力的回应

我们的最佳预估:GPT Image 2可能在2026年4月至6月之间发布,大概率先集成到ChatGPT中,随后开放API访问。

GPT Image 2可能的定价

GPT Image 1目前通过OpenAI API的价格为每张图$0.04–$0.133,具体取决于质量和分辨率。ChatGPT Plus订阅用户($20/月)可免费使用。

GPT Image 2的定价可能遵循类似结构:

层级GPT Image 1(当前)GPT Image 2(预估)
API(标准质量)$0.04/张$0.05–$0.08/张
API(高质量)$0.133/张$0.15–$0.20/张
ChatGPT Plus包含大概率包含
ChatGPT Pro包含 + 更高限额包含 + 更高限额

以上为基于OpenAI历史定价模式的预估,实际定价可能有所不同。

如何为GPT Image 2做准备

无论你是开发者、设计师还是内容创作者,以下是提前准备的建议:

  1. 现在就开始使用GPT Image 1 — 学习提示词技巧和API集成方式。GPT Image 2几乎可以确定是向后兼容的
  2. 构建灵活的工作流 — 使用像Nano Banana 2这样支持多种AI图像模型的工具,以便在GPT Image 2发布首日即可无缝切换
  3. 关注官方公告 — 跟踪OpenAI博客和LMArena排行榜获取最新动态
  4. 测试你的使用场景 — 如果游戏截图生成或复杂写实场景对你的工作流至关重要,GPT Image 2可能带来变革性体验

常见问题

GPT Image 2是什么?

GPT Image 2是OpenAI即将推出的下一代图像生成模型,是GPT Image 1的继任者。它于2026年4月在LMArena上被发现,使用maskingtape-alpha、gaffertape-alpha和packingtape-alpha三个代号进行测试。

GPT Image 2是否已被官方确认?

OpenAI尚未正式宣布GPT Image 2。然而,LMArena上的三个模型声称来自OpenAI,展现了远超GPT Image 1的能力,并在被公开发现后迅速被移除——这强烈暗示即将发布。

GPT Image 2比GPT Image 1好多少?

早期测试者将其描述为代际级飞跃。游戏截图"几乎与真实游戏画面无法区分",自然摄影展现了显著改善的写实性,复杂场景构图也大幅提升。一位测试者称其"绝对疯狂,远超nano banana"。

GPT Image 2何时可以使用?

目前没有官方日期。根据LMArena的测试模式和OpenAI的发布节奏,GPT Image 2可能在2026年4月至6月之间发布。

GPT Image 2会提供API访问吗?

几乎可以确定会。GPT Image 1通过OpenAI API以gpt-image-1模型ID提供访问,GPT Image 2很可能遵循相同模式,使用类似gpt-image-2的模型ID。

GPT Image 2与Midjourney相比如何?

根据泄露测试,GPT Image 2在写实性和提示词遵循准确性方面似乎超越了Midjourney V7,而Midjourney在艺术风格和美学质量方面可能仍保持优势。如需了解当前一代的对比,请参阅我们的完整指南


Nano Banana 2相关资源:

来源:Reddit r/singularity — GPT-IMAGE-2 Likely on LMArena,2026年4月