图像生成总览

这个能力能做什么

适用于文本生图、参考图融合、电商海报生成等场景。当前站点按 Gemini 兼容接口组织文档。

支持的模型

根据线上渠道说明，当前以图像生成预览模型为主，例如：

gemini-3-pro-image-preview

如果后续新增图像模型，建议继续归入本栏目。

请求入口

text

POST /v1beta/models/{model}:generateContent

典型参数

contents[].parts[].text：主提示词
contents[].parts[].inlineData：图片输入，支持 URL 或 base64
generationConfig.responseModalities=["IMAGE"]：要求返回图片结果
generationConfig.imageConfig.output：建议优先用 url

输入限制

当前服务端图片输入上限为 5 张
大图建议优先传公网 URL，避免请求体过大
URL 方式更适合重试和下载

相关页面