Google빠름높음

Gemini 3.1 Flash Live Preview

실시간 상호작용 및 라이브 스트리밍 시나리오에 최적화된 Gemini 3.1 Flash입니다. 전용 가격의 오디오 입력 지원과 함께 저지연 응답을 제공합니다.

300 크레딧

요청당

Live API 지원 (실시간 양방향)

저지연 스트리밍 응답

131,072 토큰 컨텍스트 윈도우

65,536 최대 출력 토큰

멀티모달 입력: 텍스트·이미지·오디오·비디오

출력 모달리티: 텍스트 + 오디오

함수 호출, Thinking, 오디오 생성, 검색 그라운딩

지금 바로 실행해보세요

콘솔의 Playground에서 별도 코드 없이 이 모델을 즉시 테스트할 수 있어요

로그인 후 사용해보기

AI 어시스턴트에서 사용하기

이 모델의 사용법을 Claude, ChatGPT 등에 복사

llms.txt

모델 상세 사양

컨텍스트 윈도우

131K

토큰

최대 출력

66K

토큰

학습 데이터

January 2025

호환 SDK

OpenAI, Google AI

기능 지원

비전

함수 호출

스트리밍

JSON 모드

시스템 프롬프트

토큰별 가격 (1M 토큰당)

토큰 종류	크레딧	달러 환산
입력 토큰	750	$0.75
출력 토큰	4,500	$4.50

* 1 크레딧 ≈ $0.001 (실제 요금은 사용량에 따라 달라질 수 있습니다)

빠른 시작

curl -X POST "https://api.core.today/llm/gemini/v1beta/openai/chat/completions" \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer cdt_your_api_key" \
  -d '{
  "model": "gemini-3.1-flash-live-preview",
  "messages": [
    {
      "role": "system",
      "content": "You are a real-time assistant. Respond quickly and concisely."
    },
    {
      "role": "user",
      "content": "What are the key differences between HTTP/2 and HTTP/3?"
    }
  ],
  "max_tokens": 1000,
  "stream": true
}'

파라미터

파라미터	타입	필수	기본값	설명
`messages`	array	Yes	-	메시지 객체 배열 (OpenAI 형식)
`temperature`	float	No	1	샘플링 온도 (0-2)
`top_p`	float	No	0.95	핵심 샘플링 파라미터
`max_tokens`	integer	No	-	최대 출력 토큰 수. 최대값: 65,536. 컨텍스트 윈도우 (입력+출력): 131,072 토큰.
`stream`	boolean	No	true	Server-Sent Events 스트리밍 활성화 (라이브 사용 시 권장)

예제

라이브 채팅

실시간 스트리밍 대화

curl -X POST "https://api.core.today/llm/gemini/v1beta/openai/chat/completions" \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer cdt_your_api_key" \
  -d '{
  "model": "gemini-3.1-flash-live-preview",
  "messages": [
    {
      "role": "system",
      "content": "You are a real-time assistant. Respond quickly and concisely."
    },
    {
      "role": "user",
      "content": "What are the key differences between HTTP/2 and HTTP/3?"
    }
  ],
  "max_tokens": 1000,
  "stream": true
}'

팁 & 모범 사례

1최대 출력 토큰: 65,536 — max_tokens는 이 한도 내에서 설정

2컨텍스트 윈도우 131,072 토큰 — Live 모델은 일반 Flash보다 작음

3최고의 실시간 경험을 위해 스트리밍 활성화

4오디오 입력 토큰은 $3.00/M으로 별도 과금

5출력은 텍스트와 오디오 양쪽을 지원

6저지연이 필요한 라이브 상호작용에 이상적

7실시간 음성 어시스턴트 및 고객 지원에 활용

사용 사례

실시간 고객 지원 상호작용

실시간 음성 기반 어시스턴트

인터랙티브 스트리밍 애플리케이션

실시간 전사 및 분석

실시간 콘텐츠 모더레이션

모델 정보

제공자Google

버전3.1-preview

카테고리LLM

가격300 크레딧

API Endpoint

POST /llm/gemini/v1beta/openai/chat/completions

Playground에서 테스트