Gemini generateContent
图片
/v1beta/models/{model}:generateContent
Generates synchronous text or multimodal output with Gemini.
POST
Gemini generateContent
Documentation Index
Fetch the complete documentation index at: https://docs.ent.apigo.ai/llms.txt
Use this file to discover all available pages before exploring further.
Gemini 官方文档把图片理解、图片生成和图片编辑都建立在 generateContent 这一套接口之上。
- 图片可以通过
inlineData直接内联传入,也可以先上传到 Files API 再引用 - 官方文档把小文件直接内联作为常见方案,更大或需要复用的图片更适合 Files API
- 适合图文问答、OCR 辅助、界面理解和视觉分析
- 原生生图和图像编辑仍走这个接口
- 文本结果和图片结果都在
candidates[].content.parts[]中,图片通常以inlineData返回 - 官方文档说明生成图片会带 SynthID 水印,因此产物链路要提前考虑这一点
