Generate content (Gemini)
圖像
Gemini 原生格式
Gemini-native generateContent interface for text chat, multimodal media recognition (images, audio, video), speech synthesis, and image generation with structured parts. Use generationConfig to request specific response modalities such as speech (speechConfig) or images (imageConfig).
POST
Generate content (Gemini)
本頁使用與 生成內容(Gemini) 相同的
generateContent 操作,上方 playground 已預先填入純文字對話範例。以下說明可加入 generationConfig 的 Gemini 原生欄位,以便透過供應商特定的回應控制來生成或編輯圖像。
請將
generationConfig.responseModalities 設為 ["IMAGE"] 以要求圖像輸出,並使用 generationConfig.imageConfig 控制長寬比與輸出尺寸。Gemini 原生請求欄位
| 欄位 | 類型 | 必填 | 說明 |
|---|---|---|---|
generationConfig.responseModalities | array | 是 | 要求的模態陣列,例如 ["IMAGE"]。 |
generationConfig.imageConfig | object | 否 | 圖像設定物件。 |
generationConfig.imageConfig.aspectRatio | string | 否 | 生成圖像的長寬比,例如 1:1。 |
generationConfig.imageConfig.imageSize | string | 否 | 輸出圖像尺寸,例如 1024x1024。 |
範例:生成圖像
回應欄位
回應遵循標準generateContent 結構。當要求圖像輸出時,回傳的 parts 會包含內嵌圖像資料:
模型回傳的候選回應。
Token 使用中繼資料,包括
promptTokenCount、candidatesTokenCount 與 totalTokenCount。回應範例
200
授權
Your DGrid API key. All endpoints use Authorization: Bearer <DGRID_API_KEY>.
路徑參數
Target model ID, such as gemini-1.5-pro.
主體
application/json

