在 2025 年 3 月的 ChatGPT 中推出后,图像生成模型 gpt-image-1 受到了热烈欢迎:在一周内创建了超过 7 亿张图像,这也促使 OpenAI 限制了该功能的访问。这个原生多模态模型能够生成各种风格的图像,遵循精细的指令,整合文本并对内容进行上下文化,现在通过图像 API 向开发者和企业开放。
据 OpenAI 称,该模型的多功能性在各个领域中解锁了无数实用应用程序。多家公司已经集成了该模型以丰富他们的产品:
- 创意工具:Adobe、Figma 和 Canva 利用 GPT-Image-1 来增强其设计平台,提供高级的图像生成和编辑功能;
- 电子商务:GoDaddy 集成了该模型以帮助用户创建可定制的标志和与其视觉身份相匹配的营销内容;
- 营销与传播:HubSpot 探索使用 GPT-Image-1 来生成面向社交媒体、广告活动和着陆页的专业视觉效果;
- 教育:教育平台使用该模型来创建交互式和插图丰富的教学材料;
- 电子游戏:一些游戏公司利用 GPT-Image-1 来生成图形资产。
定价
通过 API 访问 gpt-image-1 基于差异化的代币定价:每百万个文本代币 5 美元,图像输入 10 美元,生成的图像 40 美元。实际上,这种定价结构使每张生成图像的成本在 0.02 至 0.19 美元之间,具体取决于质量。这种定价结构促进了渐进的采用,特别是对于需要高频使用和高级定制的应用程序。
在安全方面,OpenAI 应用了与 ChatGPT 图像生成相同的保护措施:集成 C2PA 元数据以识别模型生成的图像、可配置的内容审核,以及不使用客户数据进行训练。
目前通过 OpenAI 的图像 API 提供,GPT-Image-1 将很快集成到 API Responses 中,从而扩展开发人员的交互方式。