Passer au contenu principal
POST
/
v1
/
models
/
{model}
:generateContent
Generate content (Gemini)
curl --request POST \
  --url https://api.dgrid.ai/v1/models/{model}:generateContent \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '
{
  "contents": [
    {
      "role": "user",
      "parts": [
        {
          "text": "Hello from DGrid."
        }
      ]
    }
  ]
}
'
{
  "candidates": [
    {
      "content": {
        "role": "<string>",
        "parts": [
          {}
        ]
      },
      "finishReason": "<string>",
      "safetyRatings": [
        {}
      ]
    }
  ],
  "usageMetadata": {
    "promptTokenCount": 123,
    "candidatesTokenCount": 123,
    "totalTokenCount": 123
  }
}
Cette page utilise la même opération generateContent que Générer du contenu (Gemini), avec le playground ci-dessus prérempli pour un chat en texte brut. Les notes ci-dessous décrivent les champs natifs Gemini que vous pouvez ajouter à generationConfig pour demander une compréhension ou une génération audio à l’aide de parts structurées.
Définissez generationConfig.responseModalities sur ["AUDIO"] pour demander une sortie audio, puis configurez generationConfig.speechConfig.voiceConfig.prebuiltVoiceConfig.voiceName afin de choisir une voix prédéfinie pour la synthèse vocale.

Champs de requête natifs Gemini

ChampTypeRequisDescription
generationConfig.responseModalitiesarrayOuiModalités de réponse demandées, par exemple ["AUDIO"].
generationConfig.speechConfigobjectNonObjet de configuration de la parole.
generationConfig.speechConfig.voiceConfigobjectNonConteneur de configuration vocale.
generationConfig.speechConfig.voiceConfig.prebuiltVoiceConfigobjectNonParamètres de voix prédéfinie.
generationConfig.speechConfig.voiceConfig.prebuiltVoiceConfig.voiceNamestringNonNom du préréglage de voix, par exemple Kore.
Utilisez un modèle capable de synthèse vocale, tel que gemini-2.5-flash-preview-tts, dans le paramètre de chemin model lorsque vous demandez une sortie audio.

Exemple : demander un audio de synthèse vocale

{
  "contents": [
    {
      "role": "user",
      "parts": [
        { "text": "Say cheerfully: Have a wonderful day!" }
      ]
    }
  ],
  "generationConfig": {
    "responseModalities": ["AUDIO"],
    "speechConfig": {
      "voiceConfig": {
        "prebuiltVoiceConfig": {
          "voiceName": "Kore"
        }
      }
    }
  }
}

Champs de réponse

La réponse suit la forme standard generateContent. Lorsqu’une sortie audio est demandée, les parts renvoyés contiennent des données audio inline plutôt que du texte :
candidates
array
Réponses candidates renvoyées par le modèle.
usageMetadata
object
Comptabilité des tokens, notamment promptTokenCount, candidatesTokenCount et totalTokenCount.
promptFeedback
object
Informations de blocage du prompt lorsque cela s’applique.

Exemple de réponse

200
{
  "candidates": [
    {
      "content": {
        "role": "model",
        "parts": [
          {
            "inlineData": {
              "mimeType": "audio/L16;codec=pcm;rate=24000",
              "data": "<base64-encoded-audio-bytes>"
            }
          }
        ]
      },
      "finishReason": "STOP",
      "safetyRatings": []
    }
  ],
  "usageMetadata": {
    "promptTokenCount": 10,
    "candidatesTokenCount": 0,
    "totalTokenCount": 10
  }
}

Autorisations

Authorization
string
header
requis

Your DGrid API key. All endpoints use Authorization: Bearer <DGRID_API_KEY>.

Paramètres de chemin

model
string
requis

Target model ID, such as gemini-1.5-pro.

Corps

application/json
contents
object[]

Input content array with role and parts.

generationConfig
object

Generation configuration.

Réponse

Generated content candidates.

candidates
object[]

Candidate responses returned by the model.

usageMetadata
object

Token accounting metadata.