실시간
실시간 API는 OpenAI 호환 저지연 텍스트 및 오디오 대화를 websocket과 짧은 수명의 session token 생성 엔드포인트로 제공합니다.
WebSocket 연결
백엔드가 DGrid API 키를 안전하게 보관할 수 있다면 realtime websocket 연결을 직접 열 수 있습니다.
https://api.dgrid.ai
WSS
wss://api.dgrid.ai/v1/realtime?model={model}Query 파라미터
| 파라미터 | 타입 | 필수 | 설명 |
|---|---|---|---|
model | string | 예 | realtime 모델 ID, 예: gpt-4o-realtime-preview. |
클라이언트 이벤트
| 이벤트 타입 | 설명 |
|---|---|
session.update | session 수준 설정을 업데이트합니다. |
input_audio_buffer.append | 오디오 청크를 전송합니다. |
input_audio_buffer.commit | 현재 오디오 버퍼를 커밋합니다. |
response.create | 새 어시스턴트 응답을 트리거합니다. |
conversation.item.create | 대화 항목을 추가합니다. |
서버 이벤트
| 이벤트 타입 | 설명 |
|---|---|
session.created | session 이 성공적으로 생성되었습니다. |
session.updated | session 설정이 갱신되었습니다. |
response.text.delta | 스트리밍 텍스트 증분 출력입니다. |
response.audio.delta | 스트리밍 오디오 증분 출력입니다. |
response.done | 응답이 완료되었습니다. |
error | 오류 페이로드입니다. |
Realtime Session Token 생성
아래 예시처럼 realtime HTTP 진입점에 인증된 GET 요청을 보내야 할 때 이 예시를 사용합니다.
https://api.dgrid.ai
GET
/v1/realtimeWebSocket 이벤트
저지연 대화 스트리밍은 소수의 핵심 request 및 response 이벤트를 중심으로 설계됩니다.
https://api.dgrid.ai
WSS
wss://api.dgrid.ai/v1/realtime?model={model}핵심 클라이언트 이벤트
| 이벤트 타입 | 설명 |
|---|---|
session.update | 모달리티, 음성, session 선호값을 업데이트합니다. |
input_audio_buffer.append | 인코딩된 오디오 조각을 전송합니다. |
input_audio_buffer.commit | 현재 오디오 버퍼가 처리 준비되었음을 알립니다. |
response.create | 서버에 응답 생성을 요청합니다. |
conversation.item.create | 대화 턴이나 도구 결과를 추가합니다. |
핵심 서버 이벤트
| 이벤트 타입 | 설명 |
|---|---|
session.created | websocket session 이 생성되었습니다. |
session.updated | session 설정이 변경되었습니다. |
response.text.delta | 점진적인 텍스트 출력입니다. |
response.audio.delta | 점진적인 오디오 출력입니다. |
response.done | 하나의 응답이 완료되었습니다. |
error | 복구 가능 또는 치명적 오류입니다. |
통합 가이드
- 클라이언트에서 오디오를 작은 청크로 버퍼링하고
input_audio_buffer.commit으로 turn 경계를 표시하세요. - session 이 멀티모달 출력을 지원한다면
response.text.delta와response.audio.delta를 모두 구독하세요. - 브라우저 클라이언트는 장기 API 키 대신 서버가 발급한 짧은 수명의 session token 을 사용하세요.
