图片生成
图像系列
图片生成
POST
图片生成
简介
图片生成接口支持文生图、图生图、图片编辑等多种功能。通过统一的API接口,您可以调用 Gemini、豆包 Seedream、GPT Image、通义千问等多个主流图像生成模型。认证
Bearer Token,如
Bearer sk-xxxxxxxxxx请求参数
模型标识,支持的模型包括:
- Gemini 系列:
gemini-2.5-flash-image(Nano Banana)、gemini-3-pro-image-preview(Nano Banana Pro) 等 - 豆包 Seedream 系列:
doubao-seedream-3-0-t2i-250415、doubao-seedream-4-0-250828、doubao-seedream-4-5-251128、doubao-seededit-3-0-i2i-250628等 - GPT Image 系列:
gpt-image-1等 - 通义千问系列:
qwen-image-plus、qwen-image-edit-plus等
文生图的提示词
响应格式:
b64_json 或 url注意:不同模型对 response_format 的支持情况不同:- Gemini 系列:仅支持
b64_json格式,无论传入什么值都会返回 base64 编码的图片数据 - 豆包 Seedream 系列:通常返回 URL 链接,
response_format参数可能不生效 - GPT Image 系列:仅支持
b64_json格式,强制返回 base64 编码的图片数据 - 通义千问系列:支持
b64_json和url,会根据参数值返回对应格式(b64_json会从 URL 下载并转换为 base64)
图生图或上下文对话的多轮内容
基础示例
- Gemini
- 豆包 Seedream
- GPT Image
- 通义千问
- 文生图
- 图生图
- 多图融合
模型专用参数
不同模型支持不同的参数,以下是各模型的详细参数说明:- 豆包 Seedream
- GPT Image
- Gemini
- 通义千问
doubao-seedream-3-0-t2i-250415 不支持该参数输入的图片信息。
支持 URL 或 Base64 编码。其中,doubao-seedream-4.5、doubao-seedream-4.0 支持单图或多图输入(查看多图融合示例),doubao-seededit-3.0-i2i 仅支持单图输入。
图片尺寸,支持的尺寸取决于模型版本:
- doubao-seedream-3.0:
1024x1024、1152x864、864x1152、1280x720、720x1280、1248x832、832x1248、1512x648 - doubao-seedream-4.0/4.5:
2048x2048、2304x1728、1728x2304、2560x1440、1440x2560、2496x1664、1664x2496、3024x1296(2K)或4096x4096、4704x3520、3520x4704、5504x3040、3040x5504、4992x3328、3328x4992、6240x2656(4K)
是否添加水印
随机种子,用于控制生成结果的随机性。相同 seed 会产生相似的结果。取值范围:
0 到 2147483647引导系数,控制生成图像与提示词的匹配程度。值越高越严格,越低越自由。建议范围:
1.0-10.0,默认:2.5。仅 doubao-seedream-3.0-t2i-250415 和 doubao-seededit-3.0-i2i-250628 支持组图功能开关,仅
doubao-seedream-4.0 和 doubao-seedream-4.5 支持:"auto": 启用组图功能"disabled": 禁用组图功能(默认)
组图配置选项,仅在
sequential_image_generation 为 "auto" 时生效:max_images(integer): 组图最大数量,范围1-4,默认4
仅 doubao-seedream-4.5(当前仅支持 standard 模式)、doubao-seedream-4.0 支持该参
mode(string): 优化模式"standard": 标准模式,质量更高但耗时较长(默认,4.0 和 4.5 都支持)"fast": 快速模式,耗时更短但质量一般(仅 4.0 支持)
响应格式
支持的模型
Gemini 系列
模型名称:gemini-2.5-flash-image (Nano Banana)
核心能力:
- ✅ 文生图(纯文本描述生成图片)
- ✅ 图生图(单图片+文本生成新图片)
- ✅ 多图生一图(2-5张图片融合生成)
- ✅ 多轮对话式图片生成(上下文连续修改)
gemini-3-pro-image-preview (Nano Banana Pro)
核心能力:
- ✅ 文生图(纯文本描述生成图片)
- ✅ 图生图(单图片+文本生成新图片)
- ✅ 多图生一图(2-5张图片融合生成)
- ✅ 多轮对话式图片生成(上下文连续修改)
- ✅ 更高质量的输出
豆包 Seedream 系列
模型名称:doubao-seedream-3-0-t2i-250415
核心能力:
- ✅ 文生图(纯文本描述生成图片)
- ✅ 支持引导系数调节
- ✅ 支持随机种子控制
- ❌ 不支持图生图
doubao-seedream-4-0-250828
核心能力:
- ✅ 文生图(纯文本描述生成图片)
- ✅ 图生图(单图片+文本生成新图片)
- ✅ 多图融合(2-5张图片融合生成)
- ✅ 组图功能(Sequential Image Generation)
- ✅ 支持 2K/4K 分辨率
- ✅ 支持多种图片格式
- 2K: 2048×2048、2304×1728、1728×2304、2560×1440、1440×2560、2496×1664、1664×2496、3024×1296
- 4K: 4096×4096、4704×3520、3520×4704、5504×3040、3040×5504、4992×3328、3328×4992、6240×2656
doubao-seedream-4-5-251128
核心能力:
- ✅ 文生图(纯文本描述生成图片)
- ✅ 图生图(单图片+文本生成新图片)
- ✅ 多图融合(2-5张图片融合生成)
- ✅ 组图功能(Sequential Image Generation)
- ✅ 支持 2K/4K 分辨率
- ✅ 支持提示词优化选项
- ✅ 支持多种图片格式
doubao-seededit-3-0-i2i-250628
核心能力:
- ✅ 图片编辑(单图片+文本编辑)
- ✅ 支持引导系数调节
- ✅ 支持随机种子控制
- ✅ 图片编辑(修改内容、风格迁移等)
- ❌ 不支持纯文生图
GPT 图像生成系列
模型名称:gpt-image-1
核心能力:
- ✅ 文生图(纯文本描述生成图片)
- ✅ 图生图(最多10张图片+文本)
- ✅ 支持图片质量选择
- ✅ 支持输入保真度调节
- ✅ 多图融合生成
low、medium、high
生成数量: 单次请求可生成 1-10 张图片
图片输入: 支持 JPEG、PNG、GIF、WEBP 格式,最大 10MB,最多10张图片
模型名称: gpt-image-1-mini
核心能力:
- ✅ 文生图(纯文本描述生成图片)
- ✅ 图生图(最多10张图片+文本)
- ✅ 支持图片质量选择
- ✅ 更快的生成速度
- ✅ 更低的成本
low、medium、high
生成数量: 单次请求可生成 1-10 张图片
通义千问系列
模型名称:qwen-image-plus
核心能力:
- ✅ 文生图(纯文本描述生成图片)
- ✅ 中英文文本渲染(擅长在图片中生成复杂文字)
- ✅ 多种艺术风格
- ✅ 提示词智能扩展
- ❌ 不支持图生图
qwen-image-edit-plus
核心能力:
- ✅ 图片编辑(输入一张图,输出最多可生成 6 张图片)
- ✅ 修改图内文字
- ✅ 增删/移动物体
- ✅ 迁移图片风格
- ✅ 增强画面细节
最佳实践
提示词优化建议
- Gemini (Nano Banana)
- 豆包 Seedream
- GPT Image
- 通义千问
-
明确比例需求:在提示词中说明构图方向
- 横屏:使用”横向构图”、“宽屏视角”
- 竖屏:使用”竖向构图”、“垂直视角”
-
高质量关键词:
- “高质量”、“高清”、“专业摄影”
- “8k分辨率”、“细节丰富”
-
多图融合技巧:
- 明确说明每张图片的作用
- 指定融合方式(风格迁移、元素组合等)
尺寸选择建议
- 社交媒体
- 设计用途
- 微信朋友圈: 1328×1328 (1:1) 或 1140×1472 (3:4)
- 微博头图: 1664×928 (16:9)
- 抖音封面: 928×1664 (9:16)
- 小红书: 1140×1472 (3:4)
常见问题
- 通用问题
- Gemini (Nano Banana)
- 豆包 Seedream
- GPT Image
- 通义千问
支持的图片格式有哪些?
支持的图片格式有哪些?
不同模型支持的格式不同:
- Gemini:PNG、JPEG、JPG、WEBP,最大 7MB
- 豆包 Seedream 3.0/4.0:JPEG、PNG,最大 10MB
- 豆包 Seedream 4.5:JPEG、PNG、WEBP、BMP、TIFF、GIF,最大 10MB
- GPT Image:JPEG、PNG、GIF、WEBP,最大 10MB
- 通义千问:JPEG、JPG、PNG、BMP、TIFF、WEBP,最大 10MB
生成的图片有效期是多久?
生成的图片有效期是多久?
图片URL的有效期约为24小时。建议在收到响应后立即下载保存,或上传到您自己的存储服务。
可以同时生成多张图片吗?
可以同时生成多张图片吗?
通义千问系列每次请求生成1张图片。如需多张,请发起多个并发请求。
相关资源
视频生成
查看视频生成接口文档
模型列表
查看所有支持的模型信息
