Generate content (Gemini)
Audio
Formato nativo de Gemini
Gemini-native generateContent interface for text chat, multimodal media recognition (images, audio, video), speech synthesis, and image generation with structured parts. Use generationConfig to request specific response modalities such as speech (speechConfig) or images (imageConfig).
POST
Generate content (Gemini)
Esta página usa la misma operación
generateContent que Generar contenido (Gemini), con el playground de arriba rellenado previamente para chat de texto plano. Las notas a continuación describen los campos nativos de Gemini que puede agregar a generationConfig para solicitar comprensión o generación de audio con parts estructuradas.
Establezca
generationConfig.responseModalities en ["AUDIO"] para solicitar salida de audio y configure generationConfig.speechConfig.voiceConfig.prebuiltVoiceConfig.voiceName para elegir una voz predefinida para el habla generada.Campos de solicitud nativos de Gemini
| Campo | Tipo | Obligatorio | Descripción |
|---|---|---|---|
generationConfig.responseModalities | array | Sí | Modalidades de respuesta solicitadas, por ejemplo ["AUDIO"]. |
generationConfig.speechConfig | object | No | Objeto de configuración de voz. |
generationConfig.speechConfig.voiceConfig | object | No | Contenedor de configuración de voz. |
generationConfig.speechConfig.voiceConfig.prebuiltVoiceConfig | object | No | Configuración de voz predefinida. |
generationConfig.speechConfig.voiceConfig.prebuiltVoiceConfig.voiceName | string | No | Nombre del ajuste predefinido de voz, por ejemplo Kore. |
Ejemplo: solicitar audio de voz
Campos de respuesta
La respuesta sigue la forma estándar degenerateContent. Cuando se solicita salida de audio, las parts devueltas contienen datos de audio inline en lugar de texto:
Respuestas candidatas devueltas por el modelo.
Contabilidad de tokens, incluido
promptTokenCount, candidatesTokenCount y totalTokenCount.Información de bloqueo del prompt cuando corresponda.
Ejemplo de respuesta
200
Autorizaciones
Your DGrid API key. All endpoints use Authorization: Bearer <DGRID_API_KEY>.
Parámetros de ruta
Target model ID, such as gemini-1.5-pro.
Cuerpo
application/json

