Saltar al contenido principal
POST
/
v1
/
models
/
{model}
:generateContent
Generate content (Gemini)
curl --request POST \
  --url https://api.dgrid.ai/v1/models/{model}:generateContent \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '
{
  "contents": [
    {
      "role": "user",
      "parts": [
        {
          "text": "Hello from DGrid."
        }
      ]
    }
  ]
}
'
{
  "candidates": [
    {
      "content": {
        "role": "<string>",
        "parts": [
          {}
        ]
      },
      "finishReason": "<string>",
      "safetyRatings": [
        {}
      ]
    }
  ],
  "usageMetadata": {
    "promptTokenCount": 123,
    "candidatesTokenCount": 123,
    "totalTokenCount": 123
  }
}
Esta página usa la misma operación generateContent que Generar contenido (Gemini), con el playground de arriba rellenado previamente para chat de texto plano. Las notas a continuación describen los campos nativos de Gemini que puede agregar a generationConfig para solicitar comprensión o generación de audio con parts estructuradas.
Establezca generationConfig.responseModalities en ["AUDIO"] para solicitar salida de audio y configure generationConfig.speechConfig.voiceConfig.prebuiltVoiceConfig.voiceName para elegir una voz predefinida para el habla generada.

Campos de solicitud nativos de Gemini

CampoTipoObligatorioDescripción
generationConfig.responseModalitiesarrayModalidades de respuesta solicitadas, por ejemplo ["AUDIO"].
generationConfig.speechConfigobjectNoObjeto de configuración de voz.
generationConfig.speechConfig.voiceConfigobjectNoContenedor de configuración de voz.
generationConfig.speechConfig.voiceConfig.prebuiltVoiceConfigobjectNoConfiguración de voz predefinida.
generationConfig.speechConfig.voiceConfig.prebuiltVoiceConfig.voiceNamestringNoNombre del ajuste predefinido de voz, por ejemplo Kore.
Use un modelo con capacidad de texto a voz, como gemini-2.5-flash-preview-tts, en el parámetro de ruta model cuando solicite salida de audio.

Ejemplo: solicitar audio de voz

{
  "contents": [
    {
      "role": "user",
      "parts": [
        { "text": "Say cheerfully: Have a wonderful day!" }
      ]
    }
  ],
  "generationConfig": {
    "responseModalities": ["AUDIO"],
    "speechConfig": {
      "voiceConfig": {
        "prebuiltVoiceConfig": {
          "voiceName": "Kore"
        }
      }
    }
  }
}

Campos de respuesta

La respuesta sigue la forma estándar de generateContent. Cuando se solicita salida de audio, las parts devueltas contienen datos de audio inline en lugar de texto:
candidates
array
Respuestas candidatas devueltas por el modelo.
usageMetadata
object
Contabilidad de tokens, incluido promptTokenCount, candidatesTokenCount y totalTokenCount.
promptFeedback
object
Información de bloqueo del prompt cuando corresponda.

Ejemplo de respuesta

200
{
  "candidates": [
    {
      "content": {
        "role": "model",
        "parts": [
          {
            "inlineData": {
              "mimeType": "audio/L16;codec=pcm;rate=24000",
              "data": "<base64-encoded-audio-bytes>"
            }
          }
        ]
      },
      "finishReason": "STOP",
      "safetyRatings": []
    }
  ],
  "usageMetadata": {
    "promptTokenCount": 10,
    "candidatesTokenCount": 0,
    "totalTokenCount": 10
  }
}

Autorizaciones

Authorization
string
header
requerido

Your DGrid API key. All endpoints use Authorization: Bearer <DGRID_API_KEY>.

Parámetros de ruta

model
string
requerido

Target model ID, such as gemini-1.5-pro.

Cuerpo

application/json
contents
object[]

Input content array with role and parts.

generationConfig
object

Generation configuration.

Respuesta

Generated content candidates.

candidates
object[]

Candidate responses returned by the model.

usageMetadata
object

Token accounting metadata.