圖像
圖像 API 涵蓋 Gemini 原生圖像生成、OpenAI 相容圖像端點,以及 Qwen 相容圖像工作流。
Gemini 原生格式
若您需要供應商原生多模態回應控制,請透過 Gemini generateContent 介面生成圖像。
https://api.dgrid.ai
POST
/v1/models/{model}:generateContent請求體
| 欄位 | 型別 | 必填 | 說明 |
|---|---|---|---|
contents | array | 是 | 輸入內容陣列。 |
contents[] | object | 是 | 目前範例會傳送一個只包含空物件的陣列項目。 |
generationConfig | object | 是 | 圖像生成設定。 |
generationConfig.responseModalities | array | 是 | 要返回的模態清單。 |
generationConfig.imageConfig | object | 是 | 圖像設定。 |
generationConfig.imageConfig.aspectRatio | string | 是 | 圖像長寬比。 |
generationConfig.imageConfig.imageSize | string | 是 | 圖像尺寸。 |
回應體
| 欄位 | 型別 | 說明 |
|---|---|---|
candidates | array | 模型返回的候選回應。 |
candidates[].content | object | 候選內容物件。 |
candidates[].content.role | string | 回應內容角色。 |
candidates[].content.parts | array | 返回內容片段陣列。 |
candidates[].finishReason | string | 生成結束原因。 |
candidates[].safetyRatings | array | 安全評分結果。 |
usageMetadata | object | Token 使用量中繼資料。 |
usageMetadata.promptTokenCount | integer | 輸入 token 數。 |
usageMetadata.candidatesTokenCount | integer | 輸出 token 數。 |
usageMetadata.totalTokenCount | integer | 總 token 數。 |
OpenAI 聊天格式
若您希望以 OpenAI 相容客戶端請求 Gemini 圖像生成,可使用 Chat Completions 介面。
https://api.dgrid.ai
POST
/v1/chat/completions請求體
| 欄位 | 型別 | 必填 | 說明 |
|---|---|---|---|
model | string | 是 | Gemini 支援模型 ID。 |
stream | boolean | 是 | 目前範例會傳送 true。 |
messages | array | 是 | 聊天訊息陣列。 |
messages[] | object | 是 | 目前範例包含一個空物件。 |
contents | array | 是 | 目前範例另外傳送 contents 陣列。 |
回應體
| 欄位 | 型別 | 說明 |
|---|---|---|
id | string | Completion 識別碼。 |
model | string | 產生回應的模型。 |
object | string | 最上層物件型別。 |
created | integer | 建立時間戳。 |
choices | array | 返回的 choices。 |
choices[].index | integer | Choice 索引。 |
choices[].message | object | 助手訊息物件。 |
choices[].message.role | string | 回應角色。 |
choices[].message.content | string | 回應內容。 |
choices[].finish_reason | string | 結束原因。 |
usage | object | Token 使用統計。 |
OpenAI 圖像生成
透過 OpenAI 相容 images/generations 端點生成圖像。
https://api.dgrid.ai
POST
/v1/images/generations請求體
| 欄位 | 型別 | 必填 | 預設值 | 說明 |
|---|---|---|---|---|
prompt | string | 是 | - | 圖像描述。 |
model | string | 否 | dall-e-2 | 模型,例如 dall-e-2 或 dall-e-3。 |
n | integer | 否 | 1 | 生成數量。 |
quality | string | 否 | standard | standard 或 hd。 |
response_format | string | 否 | url | url 或 b64_json。 |
size | string | 否 | 1024x1024 | 輸出尺寸。 |
style | string | 否 | vivid | vivid 或 natural。 |
user | string | 否 | - | 終端使用者識別。 |
回應體
| 欄位 | 型別 | 說明 |
|---|---|---|
created | integer | 建立時間戳。 |
data | array | 生成圖像列表。 |
data[].url | string | URL 形式輸出時的圖像連結。 |
data[].b64_json | string | Base64 形式輸出時的圖像內容。 |
data[].revised_prompt | string | 模型調整後的提示文字。 |
OpenAI 圖像編輯
透過 OpenAI 相容圖像編輯端點,搭配可選 mask 修改上傳圖像。
https://api.dgrid.ai
POST
/v1/images/editsQwen 圖像生成
透過 Qwen 相容 OpenAI 圖像端點,對 `wanx-v1` 等模型發送生成請求。
https://api.dgrid.ai
POST
/v1/images/generationsQwen 圖像編輯
透過 Qwen 相容圖像編輯流程修改已上傳圖像。
https://api.dgrid.ai
POST
/v1/images/edits