图像生成

RootFlow AI 的绘图接口兼容 OpenAI Images API。你可以用同一套 /v1/images/generations 调用 GPT-Image-2 和 Gemini 绘图模型，支持文生图、图生图、1K/2K/4K 输出。

简单说：

想要默认稳定的绘图体验，用 gpt-image-2-count
想要 Gemini / Nano Banana 风格、角色或风格一致性，用 gemini-3.1-flash-image-count 或 gemini-3-pro-image-count
想要高清图，就选带 hd-count 的模型
想要 4K，就选带 4k-count 的模型

功能特性

兼容 OpenAI /v1/images/generations 协议，现有 SDK 无缝接入
支持文生图（text-to-image）和图生图（image-to-image）
三档分辨率：1K / 2K / 4K
GPT-Image-2 和 Gemini 两套绘图模型可选
常用画面比例可选，Gemini 3.1 Flash 还支持极端长图比例
按次计费，失败不扣费

可用模型与定价

创建令牌时，按你要用的模型选择对应分组：

GPT-Image-2 模型：选择 GPT绘图计次
Gemini 模型：选择 Gemini绘图计次

下列价格为 SVIP 用户分组参考价格。

GPT-Image-2

模型名	分辨率	默认质量	价格	说明
`gpt-image-2-count`	1K	high	¥0.10 / 次	标准分辨率，所有比例可用
`gpt-image-2-hd-count`	2K	high	¥0.25 / 次	高清分辨率，所有比例可用
`gpt-image-2-4k-count`	4K	high	¥0.50 / 次	超清分辨率，仅支持 6 种宽幅比例

Gemini 绘图

模型名	分辨率	价格	说明
`gemini-2.5-flash-image-count`	1K	¥0.10 / 次	便宜、快，适合草图和轻量生成
`gemini-3.1-flash-image-count`	1K	¥0.30 / 次	Gemini 3.1 Flash 标准图
`gemini-3.1-flash-image-hd-count`	2K	¥0.40 / 次	Gemini 3.1 Flash 高清图
`gemini-3.1-flash-image-4k-count`	4K	¥0.55 / 次	Gemini 3.1 Flash 4K
`gemini-3-pro-image-count`	1K	¥0.40 / 次	Gemini 3 Pro 标准图
`gemini-3-pro-image-hd-count`	2K	¥0.40 / 次	Gemini 3 Pro 高清图
`gemini-3-pro-image-4k-count`	4K	¥0.50 / 次	Gemini 3 Pro 4K

令牌设置

创建 API Key 时，分组要选对。GPT 模型用「GPT绘图计次」，Gemini 模型用「Gemini绘图计次」。分组选错时，模型列表可能看得到，但调用会失败。

质量控制

GPT-Image-2 支持 quality 参数，可以控制生成质量：

质量档位	说明	生成速度	适用场景
`low`	低质量，细节较少	快（30-60s）	快速预览、草图
`medium`	中等质量，平衡速度与效果	中（40-80s）	日常使用
`high`	高质量，细节丰富（默认）	慢（50-120s）	最终成品、高要求场景

Gemini 模型不需要传 quality，直接选模型档位即可。

GPT-Image-2 示例：

bash

# 快速预览（低质量）
curl https://api.rootflowai.com/v1/images/generations \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer sk-xxxxxxxxxxxxxxxx" \
  -d '{
    "model": "gpt-image-2-count",
    "prompt": "一只橘猫坐在窗台上看夕阳",
    "quality": "low",
    "size": "1024x1024"
  }'

# 最终成品（高质量，默认）
curl https://api.rootflowai.com/v1/images/generations \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer sk-xxxxxxxxxxxxxxxx" \
  -d '{
    "model": "gpt-image-2-4k-count",
    "prompt": "赛博朋克风格的未来城市夜景，超精细细节",
    "quality": "high",
    "size": "2880x1680"
  }'

质量与价格

GPT-Image-2 的不同质量档位价格相同，仅影响生成速度和画面细节。建议先用 low 快速验证构图，确认后再用 high 生成最终版本。

支持的 size

支持标准 OpenAI 像素格式和比例格式，系统会自动转换：

像素格式	等效比例	类型
`1024x1024`	1:1	正方
`1536x1024`	3:2	横图
`1024x1536`	2:3	竖图
`1792x1024`	16:9	横图
`1024x1792`	9:16	竖图

也可以直接传比例格式：1:1、3:2、2:3、4:3、3:4、5:4、4:5、16:9、9:16、2:1、1:2、21:9、9:21

4K 比例限制

GPT-Image-2 的 4K 分辨率仅支持 16:9、9:16、2:1、1:2、21:9、9:21 六种宽幅比例。

Gemini 3.1 Flash 支持更宽的比例，包括 1:4、4:1、1:8、8:1 这类长图。gemini-2.5-flash-image-count 只提供 1K，不建议拿它做 2K/4K。

快速开始

文生图

curlPythonNode.js

bash

curl https://api.rootflowai.com/v1/images/generations \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer sk-xxxxxxxxxxxxxxxx" \
  -d '{
    "model": "gpt-image-2-count",
    "prompt": "一只橘猫坐在窗台上看夕阳，水彩画风格",
    "n": 1,
    "size": "1024x1024"
  }'

python

from openai import OpenAI

client = OpenAI(
    api_key="sk-xxxxxxxxxxxxxxxx",
    base_url="https://api.rootflowai.com/v1"
)

response = client.images.generate(
    model="gpt-image-2-count",
    prompt="一只橘猫坐在窗台上看夕阳，水彩画风格",
    n=1,
    size="1024x1024",
    quality="high"  # 可选：low / medium / high（默认）
)

print(response.data[0].url)

javascript

import OpenAI from "openai";

const client = new OpenAI({
  apiKey: "sk-xxxxxxxxxxxxxxxx",
  baseURL: "https://api.rootflowai.com/v1",
});

const response = await client.images.generate({
  model: "gpt-image-2-count",
  prompt: "一只橘猫坐在窗台上看夕阳，水彩画风格",
  n: 1,
  size: "1024x1024",
  quality: "high", // 可选：low / medium / high（默认）
});

console.log(response.data[0].url);

高清文生图（2K）

使用 gpt-image-2-hd-count 模型获得 2K 分辨率输出：

bash

curl https://api.rootflowai.com/v1/images/generations \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer sk-xxxxxxxxxxxxxxxx" \
  -d '{
    "model": "gpt-image-2-hd-count",
    "prompt": "赛博朋克风格的未来城市夜景，霓虹灯倒映在雨水中",
    "n": 1,
    "size": "1792x1024"
  }'

Gemini 文生图

Gemini 的调用方式和 GPT-Image-2 一样，只要换模型名。不要传 quality。

bash

curl https://api.rootflowai.com/v1/images/generations \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer sk-xxxxxxxxxxxxxxxx" \
  -d '{
    "model": "gemini-3.1-flash-image-count",
    "prompt": "一张黑色陶瓷咖啡杯的商品主图，白色背景，干净高级",
    "n": 1,
    "size": "1:1"
  }'

Gemini 4K

bash

curl https://api.rootflowai.com/v1/images/generations \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer sk-xxxxxxxxxxxxxxxx" \
  -d '{
    "model": "gemini-3-pro-image-4k-count",
    "prompt": "高端腕表广告海报，棚拍灯光，细节清晰，质感高级",
    "n": 1,
    "size": "1:1"
  }'

图生图（URL 参考图）

如果参考图已经是公网可访问的 URL，使用 /v1/images/generations，通过 JSON 的 image 字段传入参考图数组：

bash

curl https://api.rootflowai.com/v1/images/generations \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer sk-xxxxxxxxxxxxxxxx" \
  -d '{
    "model": "gpt-image-2-count",
    "prompt": "把这张照片转换成油画风格",
    "n": 1,
    "size": "1024x1024",
    "image": ["https://example.com/photo.png"]
  }'

URL 参考图说明

image 字段接受 URL 数组，最多 16 张参考图
Gemini 最多建议 14 张参考图
支持 HTTPS URL 和 base64 data URI 混填
不传 size 时输出分辨率跟随输入图；传 size 则按指定尺寸出图

图片编辑（本地文件上传）

如果参考图是本地文件，客户端继续调用 /v1/images/edits，但请求必须改成 multipart/form-data，用 -F image=@file 上传文件：

bash

curl https://api.rootflowai.com/v1/images/edits \
  -H "Authorization: Bearer sk-xxxxxxxxxxxxxxxx" \
  -F "model=gpt-image-2-count" \
  -F "prompt=把这张照片转换成油画风格" \
  -F "n=1" \
  -F "size=1024x1024" \
  -F "quality=medium" \
  -F "image=@/path/to/photo.png;type=image/png"

多张参考图可以重复传 image 字段：

bash

curl https://api.rootflowai.com/v1/images/edits \
  -H "Authorization: Bearer sk-xxxxxxxxxxxxxxxx" \
  -F "model=gpt-image-2-count" \
  -F "prompt=基于两张参考图生成一张产品海报" \
  -F "n=1" \
  -F "size=1024x1024" \
  -F "image=@/path/to/reference-1.png;type=image/png" \
  -F "image=@/path/to/reference-2.jpg;type=image/jpeg"

/v1/images/edits 只支持 multipart

不要把 Content-Type: application/json 的请求直接发送到 /v1/images/edits。如果参考图是 URL，请使用 /v1/images/generations + image 数组；如果参考图是本地文件，请使用上面的 multipart 写法。

响应格式

标准 OpenAI Images 响应格式：

json

{
  "created": 1777026453,
  "data": [
    {
      "url": "https://img.rootflowai.com/f/image/xxx.png"
    }
  ]
}

图片 URL 时效

返回的是 RootFlowAI CDN 图片链接，可以直接打开和下载。建议你仍然把重要成品保存到自己的素材库里。

AI 编程工具集成

我们提供了开源的图像生成 Skill 工具包，可以集成到 Claude Code、Codex、Cherry Studio 等 AI 编程工具中，让 AI 助手直接帮你生成和编辑图片。

GitHub 仓库：RyanWeb31110/rootflowai-image

支持的平台：

平台	安装方式
Claude Code	下载 `claude-compatible` 包，放入 `.claude/skills/`
Codex (Skill)	下载 `codex-skill` 包，放入 skills 目录
Codex (Plugin)	下载 `codex-plugin` 包，放入 `.codex-plugins/`
Cherry Studio	下载 `cherry-studio` 包，按平台说明安装

安装后，AI 助手可以通过自然语言指令帮你生图：

帮我生成一张 16:9 的赛博朋克城市海报，2K 分辨率

把这张照片转换成水彩画风格

也可以直接点名 Gemini：

用 Gemini 3.1 Flash 给我生成一张 1:1 商品主图

用 Gemini 3 Pro 4K 生成一张高端腕表广告海报

详细安装和使用说明请参考 GitHub 仓库 README。

注意事项

建议把 n 设为 1。要多张图时，多发几次请求更容易控制成本
建议不要在 prompt 中重复描述比例，通过 size 字段控制即可
生成时间：
- 1K/2K 分辨率：通常 30~90 秒
- 4K 分辨率：通常 50~150 秒
- GPT-Image-2 使用 quality=low 可缩短 20-30% 生成时间
- 请设置足够的超时时间（建议 300 秒以上，4K 建议 600 秒）
内容会经过安全审核，违规内容会被拒绝且不计费
失败请求不扣费

图像生成 ​

功能特性 ​

可用模型与定价 ​

GPT-Image-2 ​

Gemini 绘图 ​

质量控制 ​

支持的 size ​

快速开始 ​

文生图 ​

高清文生图（2K） ​

Gemini 文生图 ​

Gemini 4K ​

图生图（URL 参考图） ​

图片编辑（本地文件上传） ​

响应格式 ​

AI 编程工具集成 ​

注意事项 ​

图像生成

功能特性

可用模型与定价

GPT-Image-2

Gemini 绘图

质量控制

支持的 size

快速开始

文生图

高清文生图（2K）

Gemini 文生图

Gemini 4K

图生图（URL 参考图）

图片编辑（本地文件上传）

响应格式

AI 编程工具集成

注意事项