Generate content (Gemini)
Audio
Format Gemini natif
Gemini-native generateContent interface for text chat, multimodal media recognition (images, audio, video), speech synthesis, and image generation with structured parts. Use generationConfig to request specific response modalities such as speech (speechConfig) or images (imageConfig).
POST
Generate content (Gemini)
Cette page utilise la même opération
generateContent que Générer du contenu (Gemini), avec le playground ci-dessus prérempli pour un chat en texte brut. Les notes ci-dessous décrivent les champs natifs Gemini que vous pouvez ajouter à generationConfig pour demander une compréhension ou une génération audio à l’aide de parts structurées.
Définissez
generationConfig.responseModalities sur ["AUDIO"] pour demander une sortie audio, puis configurez generationConfig.speechConfig.voiceConfig.prebuiltVoiceConfig.voiceName afin de choisir une voix prédéfinie pour la synthèse vocale.Champs de requête natifs Gemini
| Champ | Type | Requis | Description |
|---|---|---|---|
generationConfig.responseModalities | array | Oui | Modalités de réponse demandées, par exemple ["AUDIO"]. |
generationConfig.speechConfig | object | Non | Objet de configuration de la parole. |
generationConfig.speechConfig.voiceConfig | object | Non | Conteneur de configuration vocale. |
generationConfig.speechConfig.voiceConfig.prebuiltVoiceConfig | object | Non | Paramètres de voix prédéfinie. |
generationConfig.speechConfig.voiceConfig.prebuiltVoiceConfig.voiceName | string | Non | Nom du préréglage de voix, par exemple Kore. |
Exemple : demander un audio de synthèse vocale
Champs de réponse
La réponse suit la forme standardgenerateContent. Lorsqu’une sortie audio est demandée, les parts renvoyés contiennent des données audio inline plutôt que du texte :
Réponses candidates renvoyées par le modèle.
Comptabilité des tokens, notamment
promptTokenCount, candidatesTokenCount et totalTokenCount.Informations de blocage du prompt lorsque cela s’applique.
Exemple de réponse
200
Autorisations
Your DGrid API key. All endpoints use Authorization: Bearer <DGRID_API_KEY>.
Paramètres de chemin
Target model ID, such as gemini-1.5-pro.
Corps
application/json

