Skip to main content
Core.Today
|
Google빠름높음

Gemini 3.1 Flash Live Preview

실시간 상호작용 및 라이브 스트리밍 시나리오에 최적화된 Gemini 3.1 Flash입니다. 전용 가격의 오디오 입력 지원과 함께 저지연 응답을 제공합니다.

300 크레딧
요청당
Live API 지원 (실시간 양방향)
저지연 스트리밍 응답
131,072 토큰 컨텍스트 윈도우
65,536 최대 출력 토큰
멀티모달 입력: 텍스트·이미지·오디오·비디오
출력 모달리티: 텍스트 + 오디오
함수 호출, Thinking, 오디오 생성, 검색 그라운딩

지금 바로 실행해보세요

콘솔의 Playground에서 별도 코드 없이 이 모델을 즉시 테스트할 수 있어요

로그인 후 사용해보기

AI 어시스턴트에서 사용하기

이 모델의 사용법을 Claude, ChatGPT 등에 복사

llms.txt

모델 상세 사양

컨텍스트 윈도우
131K
토큰
최대 출력
66K
토큰
학습 데이터
January 2025
호환 SDK
OpenAI, Google AI

기능 지원

비전
함수 호출
스트리밍
JSON 모드
시스템 프롬프트

토큰별 가격 (1M 토큰당)

토큰 종류크레딧달러 환산
입력 토큰750$0.75
출력 토큰4,500$4.50

* 1 크레딧 ≈ $0.001 (실제 요금은 사용량에 따라 달라질 수 있습니다)

빠른 시작

curl -X POST "https://api.core.today/llm/gemini/v1beta/openai/chat/completions" \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer cdt_your_api_key" \
  -d '{
  "model": "gemini-3.1-flash-live-preview",
  "messages": [
    {
      "role": "system",
      "content": "You are a real-time assistant. Respond quickly and concisely."
    },
    {
      "role": "user",
      "content": "What are the key differences between HTTP/2 and HTTP/3?"
    }
  ],
  "max_tokens": 1000,
  "stream": true
}'

파라미터

파라미터타입필수기본값설명
messagesarrayYes-메시지 객체 배열 (OpenAI 형식)
temperaturefloatNo1샘플링 온도 (0-2)
top_pfloatNo0.95핵심 샘플링 파라미터
max_tokensintegerNo-최대 출력 토큰 수. 최대값: 65,536. 컨텍스트 윈도우 (입력+출력): 131,072 토큰.
streambooleanNotrueServer-Sent Events 스트리밍 활성화 (라이브 사용 시 권장)

예제

라이브 채팅

실시간 스트리밍 대화

curl -X POST "https://api.core.today/llm/gemini/v1beta/openai/chat/completions" \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer cdt_your_api_key" \
  -d '{
  "model": "gemini-3.1-flash-live-preview",
  "messages": [
    {
      "role": "system",
      "content": "You are a real-time assistant. Respond quickly and concisely."
    },
    {
      "role": "user",
      "content": "What are the key differences between HTTP/2 and HTTP/3?"
    }
  ],
  "max_tokens": 1000,
  "stream": true
}'

팁 & 모범 사례

1최대 출력 토큰: 65,536 — max_tokens는 이 한도 내에서 설정
2컨텍스트 윈도우 131,072 토큰 — Live 모델은 일반 Flash보다 작음
3최고의 실시간 경험을 위해 스트리밍 활성화
4오디오 입력 토큰은 $3.00/M으로 별도 과금
5출력은 텍스트와 오디오 양쪽을 지원
6저지연이 필요한 라이브 상호작용에 이상적
7실시간 음성 어시스턴트 및 고객 지원에 활용

사용 사례

실시간 고객 지원 상호작용
실시간 음성 기반 어시스턴트
인터랙티브 스트리밍 애플리케이션
실시간 전사 및 분석
실시간 콘텐츠 모더레이션

모델 정보

제공자Google
버전3.1-preview
카테고리LLM
가격300 크레딧

API Endpoint

POST /llm/gemini/v1beta/openai/chat/completions
Playground에서 테스트문서로 돌아가기