跳转到主要内容
POST
https://llm.ai-nebula.com
/
v1
/
images
/
generations
图片生成
curl --request POST \
  --url https://llm.ai-nebula.com/v1/images/generations \
  --header 'Authorization: <authorization>' \
  --header 'Content-Type: application/json' \
  --data '
{
  "model": "<string>",
  "prompt": "<string>",
  "response_format": "<string>",
  "contents": [
    {}
  ]
}
'

简介

图片生成接口支持文生图、图生图、图片编辑等多种功能。通过统一的API接口,您可以调用 Gemini、豆包 Seedream、GPT Image、通义千问等多个主流图像生成模型。

认证

Authorization
string
必填
Bearer Token,如 Bearer sk-xxxxxxxxxx

请求参数

model
string
必填
模型标识,支持的模型包括:
  • Gemini 系列:gemini-2.5-flash-image (Nano Banana)、gemini-3-pro-image-preview (Nano Banana Pro) 等
  • 豆包 Seedream 系列:doubao-seedream-3-0-t2i-250415doubao-seedream-4-0-250828doubao-seedream-4-5-251128doubao-seededit-3-0-i2i-250628
  • GPT Image 系列:gpt-image-1
  • 通义千问系列:qwen-image-plusqwen-image-edit-plus
prompt
string
文生图的提示词
response_format
string
默认值:"url"
响应格式:b64_jsonurl注意:不同模型对 response_format 的支持情况不同:
  • Gemini 系列:仅支持 b64_json 格式,无论传入什么值都会返回 base64 编码的图片数据
  • 豆包 Seedream 系列:通常返回 URL 链接,response_format 参数可能不生效
  • GPT Image 系列:仅支持 b64_json 格式,强制返回 base64 编码的图片数据
  • 通义千问系列:支持 b64_jsonurl,会根据参数值返回对应格式(b64_json 会从 URL 下载并转换为 base64)
contents
array
图生图或上下文对话的多轮内容

基础示例

curl -X POST "https://llm.ai-nebula.com/v1/images/generations" \
-H "Authorization: Bearer sk-xxxxxxxxxx" \
-H "Content-Type: application/json" \
-d '{
"model": "gemini-2.5-flash-image",
"prompt": "一只可爱的橙色小猫坐在花园里,阳光明媚,高质量摄影",
"size": "16:9",
"quality": "high",
"n": 1,
"temperature":1.1,
"top_p":0.95,
"response_format": "b64_json",
"image_size": "2K",
"mime_type": "image/png",
"response_modalities": "image"
}'

模型专用参数

不同模型支持不同的参数,以下是各模型的详细参数说明:
image
string
doubao-seedream-3-0-t2i-250415 不支持该参数输入的图片信息。 支持 URL 或 Base64 编码。其中,doubao-seedream-4.5、doubao-seedream-4.0 支持单图或多图输入(查看多图融合示例),doubao-seededit-3.0-i2i 仅支持单图输入。
size
string
图片尺寸,支持的尺寸取决于模型版本:
  • doubao-seedream-3.0: 1024x10241152x864864x11521280x720720x12801248x832832x12481512x648
  • doubao-seedream-4.0/4.5: 2048x20482304x17281728x23042560x14401440x25602496x16641664x24963024x1296(2K)或 4096x40964704x35203520x47045504x30403040x55044992x33283328x49926240x2656(4K)
watermark
boolean
默认值:"false"
是否添加水印
seed
integer
随机种子,用于控制生成结果的随机性。相同 seed 会产生相似的结果。取值范围:02147483647
guidance_scale
number
引导系数,控制生成图像与提示词的匹配程度。值越高越严格,越低越自由。建议范围:1.0-10.0,默认:2.5。仅 doubao-seedream-3.0-t2i-250415doubao-seededit-3.0-i2i-250628 支持
sequential_image_generation
string
组图功能开关,仅 doubao-seedream-4.0doubao-seedream-4.5 支持:
  • "auto": 启用组图功能
  • "disabled": 禁用组图功能(默认)
sequential_image_generation_options
object
组图配置选项,仅在 sequential_image_generation"auto" 时生效:
  • max_images (integer): 组图最大数量,范围 1-4,默认 4
optimize_prompt_options
object
仅 doubao-seedream-4.5(当前仅支持 standard 模式)、doubao-seedream-4.0 支持该参
  • mode (string): 优化模式
    • "standard": 标准模式,质量更高但耗时较长(默认,4.0 和 4.5 都支持)
    • "fast": 快速模式,耗时更短但质量一般(仅 4.0 支持)

响应格式

{
  "code": 200,
  "msg": "操作成功",
  "data": {
    "data": [
      {
        "url": "",
        "b64_json": "iVBORw0KGgoAAAANSUhEUgAABAAAAAQA...",
        "revised_prompt": ""
      }
    ],
    "created": 1757320007
  }
}

支持的模型

Gemini 系列

模型名称: gemini-2.5-flash-image (Nano Banana) 核心能力:
  • ✅ 文生图(纯文本描述生成图片)
  • ✅ 图生图(单图片+文本生成新图片)
  • ✅ 多图生一图(2-5张图片融合生成)
  • ✅ 多轮对话式图片生成(上下文连续修改)
支持的宽高比: 1:1、3:2、2:3、3:4、4:3、4:5、5:4、9:16、16:9、21:9 图片输入: 支持 URL 和 Base64 格式,最大 7MB 模型名称: gemini-3-pro-image-preview (Nano Banana Pro) 核心能力:
  • ✅ 文生图(纯文本描述生成图片)
  • ✅ 图生图(单图片+文本生成新图片)
  • ✅ 多图生一图(2-5张图片融合生成)
  • ✅ 多轮对话式图片生成(上下文连续修改)
  • ✅ 更高质量的输出
支持的宽高比: 1:1、3:2、2:3、3:4、4:3、4:5、5:4、9:16、16:9、21:9 图片输入: 支持 URL 和 Base64 格式,最大 7MB

豆包 Seedream 系列

模型名称: doubao-seedream-3-0-t2i-250415 核心能力:
  • ✅ 文生图(纯文本描述生成图片)
  • ✅ 支持引导系数调节
  • ✅ 支持随机种子控制
  • ❌ 不支持图生图
支持的尺寸: 1024×1024、1152×864、864×1152、1280×720、720×1280、1248×832、832×1248、1512×648 模型名称: doubao-seedream-4-0-250828 核心能力:
  • ✅ 文生图(纯文本描述生成图片)
  • ✅ 图生图(单图片+文本生成新图片)
  • ✅ 多图融合(2-5张图片融合生成)
  • ✅ 组图功能(Sequential Image Generation)
  • ✅ 支持 2K/4K 分辨率
  • ✅ 支持多种图片格式
支持的尺寸:
  • 2K: 2048×2048、2304×1728、1728×2304、2560×1440、1440×2560、2496×1664、1664×2496、3024×1296
  • 4K: 4096×4096、4704×3520、3520×4704、5504×3040、3040×5504、4992×3328、3328×4992、6240×2656
图片输入: 支持 JPEG、PNG、WEBP、BMP、TIFF、GIF 格式,最大 10MB 限制说明: 最高输入加输出 15 张图,但不建议输出太多(如文生图 15 张或传入 1 张图片输出 14 张),因为输出图片越多时间越久。 模型名称: doubao-seedream-4-5-251128 核心能力:
  • ✅ 文生图(纯文本描述生成图片)
  • ✅ 图生图(单图片+文本生成新图片)
  • ✅ 多图融合(2-5张图片融合生成)
  • ✅ 组图功能(Sequential Image Generation)
  • ✅ 支持 2K/4K 分辨率
  • ✅ 支持提示词优化选项
  • ✅ 支持多种图片格式
支持的尺寸: 与 doubao-seedream-4-0 相同 图片输入: 支持 JPEG、PNG、WEBP、BMP、TIFF、GIF 格式,最大 10MB 限制说明: 最高输入加输出 15 张图,但不建议输出太多(如文生图 15 张或传入 1 张图片输出 14 张),因为输出图片越多时间越久。 模型名称: doubao-seededit-3-0-i2i-250628 核心能力:
  • ✅ 图片编辑(单图片+文本编辑)
  • ✅ 支持引导系数调节
  • ✅ 支持随机种子控制
  • ✅ 图片编辑(修改内容、风格迁移等)
  • ❌ 不支持纯文生图
支持的尺寸: 自适应(根据输入图片尺寸自动调整) 图片输入: 支持 JPEG、PNG 格式,最大 10MB,单张图片

GPT 图像生成系列

模型名称: gpt-image-1 核心能力:
  • ✅ 文生图(纯文本描述生成图片)
  • ✅ 图生图(最多10张图片+文本)
  • ✅ 支持图片质量选择
  • ✅ 支持输入保真度调节
  • ✅ 多图融合生成
支持的尺寸: 1024×1024、1024×1536、1536×1024 图片质量: lowmediumhigh 生成数量: 单次请求可生成 1-10 张图片 图片输入: 支持 JPEG、PNG、GIF、WEBP 格式,最大 10MB,最多10张图片 模型名称: gpt-image-1-mini 核心能力:
  • ✅ 文生图(纯文本描述生成图片)
  • ✅ 图生图(最多10张图片+文本)
  • ✅ 支持图片质量选择
  • ✅ 更快的生成速度
  • ✅ 更低的成本
支持的尺寸: 与 gpt-image-1 相同 图片质量: lowmediumhigh 生成数量: 单次请求可生成 1-10 张图片

通义千问系列

模型名称: qwen-image-plus 核心能力:
  • ✅ 文生图(纯文本描述生成图片)
  • ✅ 中英文文本渲染(擅长在图片中生成复杂文字)
  • ✅ 多种艺术风格
  • ✅ 提示词智能扩展
  • ❌ 不支持图生图
支持的尺寸: 1328×1328、1664×928、928×1664、1472×1140、1140×1472 计费方式: 按张计费(¥0.18/张) 模型名称: qwen-image-edit-plus 核心能力:
  • ✅ 图片编辑(输入一张图,输出最多可生成 6 张图片)
  • ✅ 修改图内文字
  • ✅ 增删/移动物体
  • ✅ 迁移图片风格
  • ✅ 增强画面细节
图片输入: 支持 JPEG、JPG、PNG、BMP、TIFF、WEBP 格式,最大 10MB 输出说明: 实际输出数量受图片内容和编辑复杂度影响,最多可生成 6 张图片

最佳实践

提示词优化建议

  1. 明确比例需求:在提示词中说明构图方向
    • 横屏:使用”横向构图”、“宽屏视角”
    • 竖屏:使用”竖向构图”、“垂直视角”
  2. 高质量关键词
    • “高质量”、“高清”、“专业摄影”
    • “8k分辨率”、“细节丰富”
  3. 多图融合技巧
    • 明确说明每张图片的作用
    • 指定融合方式(风格迁移、元素组合等)

尺寸选择建议

  • 微信朋友圈: 1328×1328 (1:1) 或 1140×1472 (3:4)
  • 微博头图: 1664×928 (16:9)
  • 抖音封面: 928×1664 (9:16)
  • 小红书: 1140×1472 (3:4)

常见问题

不同模型支持的格式不同:
  • Gemini:PNG、JPEG、JPG、WEBP,最大 7MB
  • 豆包 Seedream 3.0/4.0:JPEG、PNG,最大 10MB
  • 豆包 Seedream 4.5:JPEG、PNG、WEBP、BMP、TIFF、GIF,最大 10MB
  • GPT Image:JPEG、PNG、GIF、WEBP,最大 10MB
  • 通义千问:JPEG、JPG、PNG、BMP、TIFF、WEBP,最大 10MB
图片URL的有效期约为24小时。建议在收到响应后立即下载保存,或上传到您自己的存储服务。
通义千问系列每次请求生成1张图片。如需多张,请发起多个并发请求。

相关资源