Generate content (Gemini)
이미지
네이티브 Gemini 형식
Gemini-native generateContent interface for text chat, multimodal media recognition (images, audio, video), speech synthesis, and image generation with structured parts. Use generationConfig to request specific response modalities such as speech (speechConfig) or images (imageConfig).
POST
Generate content (Gemini)
이 페이지는 콘텐츠 생성 (Gemini)과 동일한
generateContent 작업을 사용하며, 위의 플레이그라운드에는 일반 텍스트 채팅이 미리 입력되어 있습니다. 아래 내용은 제공자별 응답 제어를 통해 이미지를 생성하거나 편집하기 위해 generationConfig에 추가할 수 있는 Gemini 네이티브 필드를 설명합니다.
이미지 출력을 요청하려면
generationConfig.responseModalities를 ["IMAGE"]로 설정하고, 종횡비와 출력 크기를 제어하려면 generationConfig.imageConfig를 사용하세요.Gemini 네이티브 요청 필드
| 필드 | 유형 | 필수 | 설명 |
|---|---|---|---|
generationConfig.responseModalities | array | 예 | 요청할 모달리티 배열입니다 (예: ["IMAGE"]). |
generationConfig.imageConfig | object | 아니요 | 이미지 설정 객체입니다. |
generationConfig.imageConfig.aspectRatio | string | 아니요 | 생성할 이미지의 종횡비입니다 (예: 1:1). |
generationConfig.imageConfig.imageSize | string | 아니요 | 출력 이미지 크기입니다 (예: 1024x1024). |
예시: 이미지 생성
응답 필드
응답은 표준generateContent 형식을 따릅니다. 이미지 출력을 요청한 경우, 반환되는 parts에는 인라인 이미지 데이터가 포함됩니다.
모델이 반환한 후보 응답입니다.
promptTokenCount, candidatesTokenCount, totalTokenCount를 포함한 토큰 사용 메타데이터입니다.응답 예시
200
인증
Your DGrid API key. All endpoints use Authorization: Bearer <DGRID_API_KEY>.
경로 매개변수
Target model ID, such as gemini-1.5-pro.
본문
application/json

