Reconnaissance média Gemini

Generate content (Gemini)

curl --request POST \
  --url https://api.dgrid.ai/v1/models/{model}:generateContent \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '
{
  "contents": [
    {
      "role": "user",
      "parts": [
        {
          "text": "Hello from DGrid."
        }
      ]
    }
  ]
}
'

import requests

url = "https://api.dgrid.ai/v1/models/{model}:generateContent"

payload = { "contents": [
        {
            "role": "user",
            "parts": [{ "text": "Hello from DGrid." }]
        }
    ] }
headers = {
    "Authorization": "Bearer <token>",
    "Content-Type": "application/json"
}

response = requests.post(url, json=payload, headers=headers)

print(response.text)

const options = {
  method: 'POST',
  headers: {Authorization: 'Bearer <token>', 'Content-Type': 'application/json'},
  body: JSON.stringify({contents: [{role: 'user', parts: [{text: 'Hello from DGrid.'}]}]})
};

fetch('https://api.dgrid.ai/v1/models/{model}:generateContent', options)
  .then(res => res.json())
  .then(res => console.log(res))
  .catch(err => console.error(err));

package main

import (
	"fmt"
	"strings"
	"net/http"
	"io"
)

func main() {

	url := "https://api.dgrid.ai/v1/models/{model}:generateContent"

	payload := strings.NewReader("{\n  \"contents\": [\n    {\n      \"role\": \"user\",\n      \"parts\": [\n        {\n          \"text\": \"Hello from DGrid.\"\n        }\n      ]\n    }\n  ]\n}")

	req, _ := http.NewRequest("POST", url, payload)

	req.Header.Add("Authorization", "Bearer <token>")
	req.Header.Add("Content-Type", "application/json")

	res, _ := http.DefaultClient.Do(req)

	defer res.Body.Close()
	body, _ := io.ReadAll(res.Body)

	fmt.Println(string(body))

}

HttpResponse<String> response = Unirest.post("https://api.dgrid.ai/v1/models/{model}:generateContent")
  .header("Authorization", "Bearer <token>")
  .header("Content-Type", "application/json")
  .body("{\n  \"contents\": [\n    {\n      \"role\": \"user\",\n      \"parts\": [\n        {\n          \"text\": \"Hello from DGrid.\"\n        }\n      ]\n    }\n  ]\n}")
  .asString();

{
  "candidates": [
    {
      "content": {
        "role": "<string>",
        "parts": [
          {}
        ]
      },
      "finishReason": "<string>",
      "safetyRatings": [
        {}
      ]
    }
  ],
  "usageMetadata": {
    "promptTokenCount": 123,
    "candidatesTokenCount": 123,
    "totalTokenCount": 123
  }
}

{
  "error": {
    "message": "<string>",
    "type": "<string>",
    "param": "<string>",
    "code": "<string>"
  }
}

POST

models

{model}

:generateContent

Generate content (Gemini)

curl --request POST \
  --url https://api.dgrid.ai/v1/models/{model}:generateContent \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '
{
  "contents": [
    {
      "role": "user",
      "parts": [
        {
          "text": "Hello from DGrid."
        }
      ]
    }
  ]
}
'

import requests

url = "https://api.dgrid.ai/v1/models/{model}:generateContent"

payload = { "contents": [
        {
            "role": "user",
            "parts": [{ "text": "Hello from DGrid." }]
        }
    ] }
headers = {
    "Authorization": "Bearer <token>",
    "Content-Type": "application/json"
}

response = requests.post(url, json=payload, headers=headers)

print(response.text)

const options = {
  method: 'POST',
  headers: {Authorization: 'Bearer <token>', 'Content-Type': 'application/json'},
  body: JSON.stringify({contents: [{role: 'user', parts: [{text: 'Hello from DGrid.'}]}]})
};

fetch('https://api.dgrid.ai/v1/models/{model}:generateContent', options)
  .then(res => res.json())
  .then(res => console.log(res))
  .catch(err => console.error(err));

package main

import (
	"fmt"
	"strings"
	"net/http"
	"io"
)

func main() {

	url := "https://api.dgrid.ai/v1/models/{model}:generateContent"

	payload := strings.NewReader("{\n  \"contents\": [\n    {\n      \"role\": \"user\",\n      \"parts\": [\n        {\n          \"text\": \"Hello from DGrid.\"\n        }\n      ]\n    }\n  ]\n}")

	req, _ := http.NewRequest("POST", url, payload)

	req.Header.Add("Authorization", "Bearer <token>")
	req.Header.Add("Content-Type", "application/json")

	res, _ := http.DefaultClient.Do(req)

	defer res.Body.Close()
	body, _ := io.ReadAll(res.Body)

	fmt.Println(string(body))

}

HttpResponse<String> response = Unirest.post("https://api.dgrid.ai/v1/models/{model}:generateContent")
  .header("Authorization", "Bearer <token>")
  .header("Content-Type", "application/json")
  .body("{\n  \"contents\": [\n    {\n      \"role\": \"user\",\n      \"parts\": [\n        {\n          \"text\": \"Hello from DGrid.\"\n        }\n      ]\n    }\n  ]\n}")
  .asString();

{
  "candidates": [
    {
      "content": {
        "role": "<string>",
        "parts": [
          {}
        ]
      },
      "finishReason": "<string>",
      "safetyRatings": [
        {}
      ]
    }
  ],
  "usageMetadata": {
    "promptTokenCount": 123,
    "candidatesTokenCount": 123,
    "totalTokenCount": 123
  }
}

{
  "error": {
    "message": "<string>",
    "type": "<string>",
    "param": "<string>",
    "code": "<string>"
  }
}

Cette page utilise la même opération generateContent que Générer du contenu (Gemini), avec le playground ci-dessus prérempli pour un chat en texte brut. Les notes ci-dessous décrivent les champs multimodaux natifs Gemini que vous pouvez ajouter à contents[].parts pour analyser des images, de l’audio, de la vidéo ou des médias mixtes dans une seule requête.

Chaque part peut transporter des données inline (octets encodés en base64 plus un type MIME) en plus d’instructions textuelles, ce qui permet au modèle de raisonner sur plusieurs modalités en un seul appel.

Champs de requête natifs Gemini

Les champs génériques contents et generationConfig affichés dans le playground acceptent la forme imbriquée suivante pour la reconnaissance multimodale :

Champ	Type	Requis	Description
`contents[].role`	string	Non	Rôle du tour, par exemple `user`.
`contents[].parts`	array	Oui	Liste ordonnée des parts de contenu (texte et/ou média inline).
`contents[].parts[].text`	string	Non	Instruction textuelle ou question pour le modèle.
`contents[].parts[].inlineData`	object	Non	Charge utile média inline pour la compréhension d’image, d’audio ou de vidéo.
`contents[].parts[].inlineData.mimeType`	string	Non	Type MIME des données inline, par exemple `image/jpeg`, `audio/mp3`, `video/mp4`.
`contents[].parts[].inlineData.data`	string	Non	Octets média encodés en base64.

Vous pouvez mélanger plusieurs parts dans un même tour, par exemple une part text contenant l’instruction, suivie d’une ou plusieurs parts inlineData contenant les médias à analyser.

Exemple : analyser une image

{
  "contents": [
    {
      "role": "user",
      "parts": [
        { "text": "Describe what is happening in this image." },
        {
          "inlineData": {
            "mimeType": "image/jpeg",
            "data": "<base64-encoded-image-bytes>"
          }
        }
      ]
    }
  ]
}

Champs de réponse

La réponse suit la forme standard generateContent. Les champs les plus pertinents pour la reconnaissance média sont :

array

Réponses candidates renvoyées par le modèle.

Afficher candidate properties

object

Objet de contenu généré.

Afficher content properties

string

Rôle renvoyé dans le bloc de contenu généré, généralement model.

array

Parts de contenu renvoyées, généralement du texte décrivant le média analysé.

string

Chaîne indiquant la raison de fin, par exemple STOP.

array

Résultats d’évaluation de sécurité.

object

Métadonnées de comptabilité des tokens, notamment promptTokenCount, candidatesTokenCount et totalTokenCount. Les médias inline (images, audio, vidéo) consomment des tokens de prompt en plus des éventuelles parts textuelles.

Exemple de réponse

200

{
  "candidates": [
    {
      "content": {
        "role": "model",
        "parts": [
          { "text": "The image shows a golden retriever sitting on a grassy lawn." }
        ]
      },
      "finishReason": "STOP",
      "safetyRatings": []
    }
  ],
  "usageMetadata": {
    "promptTokenCount": 264,
    "candidatesTokenCount": 18,
    "totalTokenCount": 282
  }
}

Autorisations

Authorization

string

header

requis

Your DGrid API key. All endpoints use Authorization: Bearer <DGRID_API_KEY>.

Paramètres de chemin

model

string

requis

Target model ID, such as gemini-1.5-pro.

Corps

application/json

contents

object[]

Input content array with role and parts.

Show child attributes

generationConfig

object

Generation configuration.

Show child attributes

Réponse

Generated content candidates.

candidates

object[]

Candidate responses returned by the model.

Show child attributes

usageMetadata

object

Token accounting metadata.

Show child attributes

Générer du contenu

Créer une complétion

PRISE EN MAIN

API DE MODÈLES

CLÉS API DE GESTION

API X402

Reconnaissance média Gemini

Champs de requête natifs Gemini

Exemple : analyser une image

Champs de réponse

Exemple de réponse

Autorisations

Paramètres de chemin

Corps

Réponse

​Champs de requête natifs Gemini

​Exemple : analyser une image

​Champs de réponse

​Exemple de réponse

Autorisations

Paramètres de chemin

Corps

Réponse

Champs de requête natifs Gemini

Exemple : analyser une image

Champs de réponse

Exemple de réponse