切换主题
图像生成总览
这个能力能做什么
适用于文本生图、参考图融合、电商海报生成等场景。当前站点按 Gemini 兼容接口组织文档。
支持的模型
根据线上渠道说明,当前以图像生成预览模型为主,例如:
gemini-3-pro-image-preview
如果后续新增图像模型,建议继续归入本栏目。
请求入口
text
POST /v1beta/models/{model}:generateContent典型参数
contents[].parts[].text:主提示词contents[].parts[].inlineData:图片输入,支持 URL 或 base64generationConfig.responseModalities=["IMAGE"]:要求返回图片结果generationConfig.imageConfig.output:建议优先用url
输入限制
- 当前服务端图片输入上限为 5 张
- 大图建议优先传公网 URL,避免请求体过大
- URL 方式更适合重试和下载