Skip to content

多模态对话总览

这个能力能做什么

适用于图片理解、中文描述、提示词反推、图像内容结构化提取等场景。

请求入口

text
POST /v1/chat/completions

内容结构

messages[].content 支持多模态数组:

  • {"type":"text","text":"..."}
  • {"type":"image_url","image_url":{"url":"data:image/...;base64,..."}}

输入限制

  • 当前页面说明里,多图输入上限为 3 张
  • 可以使用 base64,也可以在兼容实现中使用公网 URL

相关页面

以 VitePress 构建,由 Cloudflare Pages 发布