Generate content (Gemini)
Imágenes
Formato nativo de Gemini
Gemini-native generateContent interface for text chat, multimodal media recognition (images, audio, video), speech synthesis, and image generation with structured parts. Use generationConfig to request specific response modalities such as speech (speechConfig) or images (imageConfig).
POST
Generate content (Gemini)
Esta página usa la misma operación
generateContent que Generar contenido (Gemini), con el playground de arriba rellenado previamente para chat de texto plano. Las notas a continuación describen los campos nativos de Gemini que puede agregar a generationConfig para generar o editar imágenes con controles de respuesta específicos del proveedor.
Establezca
generationConfig.responseModalities en ["IMAGE"] para solicitar salida de imagen y use generationConfig.imageConfig para controlar la relación de aspecto y el tamaño de salida.Campos de solicitud nativos de Gemini
| Campo | Tipo | Obligatorio | Descripción |
|---|---|---|---|
generationConfig.responseModalities | array | Sí | Matriz de modalidades solicitadas, por ejemplo ["IMAGE"]. |
generationConfig.imageConfig | object | No | Objeto de configuración de imagen. |
generationConfig.imageConfig.aspectRatio | string | No | Relación de aspecto de la imagen generada, por ejemplo 1:1. |
generationConfig.imageConfig.imageSize | string | No | Tamaño de salida de la imagen, por ejemplo 1024x1024. |
Ejemplo: generar una imagen
Campos de respuesta
La respuesta sigue la forma estándar degenerateContent. Cuando se solicita salida de imagen, las parts devueltas contienen datos de imagen inline:
Respuestas candidatas devueltas por el modelo.
Metadatos de uso de tokens, incluido
promptTokenCount, candidatesTokenCount y totalTokenCount.Ejemplo de respuesta
200
Autorizaciones
Your DGrid API key. All endpoints use Authorization: Bearer <DGRID_API_KEY>.
Parámetros de ruta
Target model ID, such as gemini-1.5-pro.
Cuerpo
application/json

