Generate content (Gemini)
Images
Format Gemini natif
Gemini-native generateContent interface for text chat, multimodal media recognition (images, audio, video), speech synthesis, and image generation with structured parts. Use generationConfig to request specific response modalities such as speech (speechConfig) or images (imageConfig).
POST
Generate content (Gemini)
Cette page utilise la même opération
generateContent que Générer du contenu (Gemini), avec le playground ci-dessus prérempli pour un chat en texte brut. Les notes ci-dessous décrivent les champs natifs Gemini que vous pouvez ajouter à generationConfig pour générer ou modifier des images avec des contrôles de réponse spécifiques au fournisseur.
Définissez
generationConfig.responseModalities sur ["IMAGE"] pour demander une sortie image, puis utilisez generationConfig.imageConfig pour contrôler le ratio d’aspect et la taille de sortie.Champs de requête natifs Gemini
| Champ | Type | Requis | Description |
|---|---|---|---|
generationConfig.responseModalities | array | Oui | Tableau des modalités demandées, par exemple ["IMAGE"]. |
generationConfig.imageConfig | object | Non | Objet de configuration d’image. |
generationConfig.imageConfig.aspectRatio | string | Non | Ratio d’aspect de l’image générée, par exemple 1:1. |
generationConfig.imageConfig.imageSize | string | Non | Taille de sortie de l’image, par exemple 1024x1024. |
Exemple : générer une image
Champs de réponse
La réponse suit la forme standardgenerateContent. Lorsqu’une sortie image est demandée, les parts renvoyés contiennent des données image inline :
Réponses candidates renvoyées par le modèle.
Métadonnées d’utilisation des tokens, notamment
promptTokenCount, candidatesTokenCount et totalTokenCount.Exemple de réponse
200
Autorisations
Your DGrid API key. All endpoints use Authorization: Bearer <DGRID_API_KEY>.
Paramètres de chemin
Target model ID, such as gemini-1.5-pro.
Corps
application/json

