Skip to content

图像生成

RootFlow AI 的绘图接口兼容 OpenAI Images API。你可以用同一套 /v1/images/generations 调用 GPT-Image-2 和 Gemini 绘图模型,支持文生图、图生图、1K/2K/4K 输出。

简单说:

  • 想要默认稳定的绘图体验,用 gpt-image-2-count
  • 想要 Gemini / Nano Banana 风格、角色或风格一致性,用 gemini-3.1-flash-image-countgemini-3-pro-image-count
  • 想要高清图,就选带 hd-count 的模型
  • 想要 4K,就选带 4k-count 的模型

功能特性

  • 兼容 OpenAI /v1/images/generations 协议,现有 SDK 无缝接入
  • 支持文生图(text-to-image)和图生图(image-to-image)
  • 三档分辨率:1K / 2K / 4K
  • GPT-Image-2 和 Gemini 两套绘图模型可选
  • 常用画面比例可选,Gemini 3.1 Flash 还支持极端长图比例
  • 按次计费,失败不扣费

可用模型与定价

创建令牌时,按你要用的模型选择对应分组:

  • GPT-Image-2 模型:选择 GPT绘图计次
  • Gemini 模型:选择 Gemini绘图计次

下列价格为 SVIP 用户分组参考价格。

GPT-Image-2

模型名分辨率默认质量价格说明
gpt-image-2-count1Khigh¥0.10 / 次标准分辨率,所有比例可用
gpt-image-2-hd-count2Khigh¥0.25 / 次高清分辨率,所有比例可用
gpt-image-2-4k-count4Khigh¥0.50 / 次超清分辨率,仅支持 6 种宽幅比例

Gemini 绘图

模型名分辨率价格说明
gemini-2.5-flash-image-count1K¥0.10 / 次便宜、快,适合草图和轻量生成
gemini-3.1-flash-image-count1K¥0.30 / 次Gemini 3.1 Flash 标准图
gemini-3.1-flash-image-hd-count2K¥0.40 / 次Gemini 3.1 Flash 高清图
gemini-3.1-flash-image-4k-count4K¥0.55 / 次Gemini 3.1 Flash 4K
gemini-3-pro-image-count1K¥0.40 / 次Gemini 3 Pro 标准图
gemini-3-pro-image-hd-count2K¥0.40 / 次Gemini 3 Pro 高清图
gemini-3-pro-image-4k-count4K¥0.50 / 次Gemini 3 Pro 4K

令牌设置

创建 API Key 时,分组要选对。GPT 模型用「GPT绘图计次」,Gemini 模型用「Gemini绘图计次」。分组选错时,模型列表可能看得到,但调用会失败。

质量控制

GPT-Image-2 支持 quality 参数,可以控制生成质量:

质量档位说明生成速度适用场景
low低质量,细节较少快(30-60s)快速预览、草图
medium中等质量,平衡速度与效果中(40-80s)日常使用
high高质量,细节丰富(默认)慢(50-120s)最终成品、高要求场景

Gemini 模型不需要传 quality,直接选模型档位即可。

GPT-Image-2 示例

bash
# 快速预览(低质量)
curl https://api.rootflowai.com/v1/images/generations \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer sk-xxxxxxxxxxxxxxxx" \
  -d '{
    "model": "gpt-image-2-count",
    "prompt": "一只橘猫坐在窗台上看夕阳",
    "quality": "low",
    "size": "1024x1024"
  }'

# 最终成品(高质量,默认)
curl https://api.rootflowai.com/v1/images/generations \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer sk-xxxxxxxxxxxxxxxx" \
  -d '{
    "model": "gpt-image-2-4k-count",
    "prompt": "赛博朋克风格的未来城市夜景,超精细细节",
    "quality": "high",
    "size": "2880x1680"
  }'

质量与价格

GPT-Image-2 的不同质量档位价格相同,仅影响生成速度和画面细节。建议先用 low 快速验证构图,确认后再用 high 生成最终版本。

支持的 size

支持标准 OpenAI 像素格式和比例格式,系统会自动转换:

像素格式等效比例类型
1024x10241:1正方
1536x10243:2横图
1024x15362:3竖图
1792x102416:9横图
1024x17929:16竖图

也可以直接传比例格式:1:13:22:34:33:45:44:516:99:162:11:221:99:21

4K 比例限制

GPT-Image-2 的 4K 分辨率仅支持 16:99:162:11:221:99:21 六种宽幅比例。

Gemini 3.1 Flash 支持更宽的比例,包括 1:44:11:88:1 这类长图。gemini-2.5-flash-image-count 只提供 1K,不建议拿它做 2K/4K。

快速开始

文生图

bash
curl https://api.rootflowai.com/v1/images/generations \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer sk-xxxxxxxxxxxxxxxx" \
  -d '{
    "model": "gpt-image-2-count",
    "prompt": "一只橘猫坐在窗台上看夕阳,水彩画风格",
    "n": 1,
    "size": "1024x1024"
  }'
python
from openai import OpenAI

client = OpenAI(
    api_key="sk-xxxxxxxxxxxxxxxx",
    base_url="https://api.rootflowai.com/v1"
)

response = client.images.generate(
    model="gpt-image-2-count",
    prompt="一只橘猫坐在窗台上看夕阳,水彩画风格",
    n=1,
    size="1024x1024",
    quality="high"  # 可选:low / medium / high(默认)
)

print(response.data[0].url)
javascript
import OpenAI from "openai";

const client = new OpenAI({
  apiKey: "sk-xxxxxxxxxxxxxxxx",
  baseURL: "https://api.rootflowai.com/v1",
});

const response = await client.images.generate({
  model: "gpt-image-2-count",
  prompt: "一只橘猫坐在窗台上看夕阳,水彩画风格",
  n: 1,
  size: "1024x1024",
  quality: "high", // 可选:low / medium / high(默认)
});

console.log(response.data[0].url);

高清文生图(2K)

使用 gpt-image-2-hd-count 模型获得 2K 分辨率输出:

bash
curl https://api.rootflowai.com/v1/images/generations \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer sk-xxxxxxxxxxxxxxxx" \
  -d '{
    "model": "gpt-image-2-hd-count",
    "prompt": "赛博朋克风格的未来城市夜景,霓虹灯倒映在雨水中",
    "n": 1,
    "size": "1792x1024"
  }'

Gemini 文生图

Gemini 的调用方式和 GPT-Image-2 一样,只要换模型名。不要传 quality

bash
curl https://api.rootflowai.com/v1/images/generations \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer sk-xxxxxxxxxxxxxxxx" \
  -d '{
    "model": "gemini-3.1-flash-image-count",
    "prompt": "一张黑色陶瓷咖啡杯的商品主图,白色背景,干净高级",
    "n": 1,
    "size": "1:1"
  }'

Gemini 4K

bash
curl https://api.rootflowai.com/v1/images/generations \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer sk-xxxxxxxxxxxxxxxx" \
  -d '{
    "model": "gemini-3-pro-image-4k-count",
    "prompt": "高端腕表广告海报,棚拍灯光,细节清晰,质感高级",
    "n": 1,
    "size": "1:1"
  }'

图生图(URL 参考图)

如果参考图已经是公网可访问的 URL,使用 /v1/images/generations,通过 JSON 的 image 字段传入参考图数组:

bash
curl https://api.rootflowai.com/v1/images/generations \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer sk-xxxxxxxxxxxxxxxx" \
  -d '{
    "model": "gpt-image-2-count",
    "prompt": "把这张照片转换成油画风格",
    "n": 1,
    "size": "1024x1024",
    "image": ["https://example.com/photo.png"]
  }'

URL 参考图说明

  • image 字段接受 URL 数组,最多 16 张参考图
  • Gemini 最多建议 14 张参考图
  • 支持 HTTPS URL 和 base64 data URI 混填
  • 不传 size 时输出分辨率跟随输入图;传 size 则按指定尺寸出图

图片编辑(本地文件上传)

如果参考图是本地文件,客户端继续调用 /v1/images/edits,但请求必须改成 multipart/form-data,用 -F image=@file 上传文件:

bash
curl https://api.rootflowai.com/v1/images/edits \
  -H "Authorization: Bearer sk-xxxxxxxxxxxxxxxx" \
  -F "model=gpt-image-2-count" \
  -F "prompt=把这张照片转换成油画风格" \
  -F "n=1" \
  -F "size=1024x1024" \
  -F "quality=medium" \
  -F "image=@/path/to/photo.png;type=image/png"

多张参考图可以重复传 image 字段:

bash
curl https://api.rootflowai.com/v1/images/edits \
  -H "Authorization: Bearer sk-xxxxxxxxxxxxxxxx" \
  -F "model=gpt-image-2-count" \
  -F "prompt=基于两张参考图生成一张产品海报" \
  -F "n=1" \
  -F "size=1024x1024" \
  -F "image=@/path/to/reference-1.png;type=image/png" \
  -F "image=@/path/to/reference-2.jpg;type=image/jpeg"

/v1/images/edits 只支持 multipart

不要把 Content-Type: application/json 的请求直接发送到 /v1/images/edits。如果参考图是 URL,请使用 /v1/images/generations + image 数组;如果参考图是本地文件,请使用上面的 multipart 写法。

响应格式

标准 OpenAI Images 响应格式:

json
{
  "created": 1777026453,
  "data": [
    {
      "url": "https://img.rootflowai.com/f/image/xxx.png"
    }
  ]
}

图片 URL 时效

返回的是 RootFlowAI CDN 图片链接,可以直接打开和下载。建议你仍然把重要成品保存到自己的素材库里。

AI 编程工具集成

我们提供了开源的图像生成 Skill 工具包,可以集成到 Claude Code、Codex、Cherry Studio 等 AI 编程工具中,让 AI 助手直接帮你生成和编辑图片。

GitHub 仓库RyanWeb31110/rootflowai-image

支持的平台:

平台安装方式
Claude Code下载 claude-compatible 包,放入 .claude/skills/
Codex (Skill)下载 codex-skill 包,放入 skills 目录
Codex (Plugin)下载 codex-plugin 包,放入 .codex-plugins/
Cherry Studio下载 cherry-studio 包,按平台说明安装

安装后,AI 助手可以通过自然语言指令帮你生图:

帮我生成一张 16:9 的赛博朋克城市海报,2K 分辨率
把这张照片转换成水彩画风格

也可以直接点名 Gemini:

用 Gemini 3.1 Flash 给我生成一张 1:1 商品主图
用 Gemini 3 Pro 4K 生成一张高端腕表广告海报

详细安装和使用说明请参考 GitHub 仓库 README

注意事项

  1. 建议把 n 设为 1。要多张图时,多发几次请求更容易控制成本
  2. 建议不要在 prompt 中重复描述比例,通过 size 字段控制即可
  3. 生成时间
    • 1K/2K 分辨率:通常 30~90 秒
    • 4K 分辨率:通常 50~150 秒
    • GPT-Image-2 使用 quality=low 可缩短 20-30% 生成时间
    • 请设置足够的超时时间(建议 300 秒以上,4K 建议 600 秒)
  4. 内容会经过安全审核,违规内容会被拒绝且不计费
  5. 失败请求不扣费