Skip to main content
Core.Today
|
Google빠름표준

Gemini 3.1 Flash Lite Preview

Gemini 3.1 Flash의 초경량 변형 모델입니다. 캐시된 입력과 오디오 입력을 지원하는 가장 비용 효율적인 Gemini 모델입니다. 고처리량, 비용 의식적 애플리케이션에 적합합니다.

100 크레딧
요청당
가장 비용 효율적인 Gemini 모델
캐시된 입력 토큰 지원
오디오 입력 지원
빠른 추론 속도
함수 호출 & JSON 모드

AI 어시스턴트에서 사용하기

이 모델의 사용법을 Claude, ChatGPT 등에 복사

llms.txt

모델 상세 사양

컨텍스트 윈도우
1M
토큰
최대 출력
66K
토큰
학습 데이터
January 2025
호환 SDK
OpenAI, Google AI

기능 지원

비전
함수 호출
스트리밍
JSON 모드
시스템 프롬프트

토큰별 가격 (1M 토큰당)

토큰 종류크레딧달러 환산
입력 토큰250$0.25
출력 토큰1,500$1.50

* 1 크레딧 ≈ $0.001 (실제 요금은 사용량에 따라 달라질 수 있습니다)

빠른 시작

curl -X POST "https://api.core.today/llm/gemini/v1beta/openai/chat/completions" \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer cdt_your_api_key" \
  -d '{
  "model": "gemini-3.1-flash-lite-preview",
  "messages": [
    {
      "role": "system",
      "content": "Classify the following text as: spam, not_spam. Respond with only the label."
    },
    {
      "role": "user",
      "content": "Congratulations! You have been selected for a special prize. Click here to claim now!"
    }
  ],
  "max_tokens": 50,
  "temperature": 0
}'

파라미터

파라미터타입필수기본값설명
messagesarrayYes-메시지 객체 배열 (OpenAI 형식)
temperaturefloatNo1샘플링 온도 (0-2)
top_pfloatNo0.95핵심 샘플링 파라미터
max_tokensintegerNo-최대 출력 토큰 수
streambooleanNofalseServer-Sent Events 스트리밍 활성화

예제

빠른 분류

Flash Lite를 활용한 경량 텍스트 분류

curl -X POST "https://api.core.today/llm/gemini/v1beta/openai/chat/completions" \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer cdt_your_api_key" \
  -d '{
  "model": "gemini-3.1-flash-lite-preview",
  "messages": [
    {
      "role": "system",
      "content": "Classify the following text as: spam, not_spam. Respond with only the label."
    },
    {
      "role": "user",
      "content": "Congratulations! You have been selected for a special prize. Click here to claim now!"
    }
  ],
  "max_tokens": 50,
  "temperature": 0
}'

팁 & 모범 사례

1가장 저렴한 Gemini 모델 — $0.25/$1.50/M 토큰
2비용 절감을 위해 반복 컨텍스트에 캐시된 입력 토큰 활용
3대량 분류 및 라우팅 작업에 이상적
4음성 기반 애플리케이션을 위한 오디오 입력 지원

사용 사례

대량 텍스트 처리
실시간 채팅 애플리케이션
빠른 분류 및 라우팅
경량 데이터 추출
오디오 전사 및 이해

모델 정보

제공자Google
버전3.1-preview
카테고리LLM
가격100 크레딧

API Endpoint

POST /llm/gemini/v1beta/openai/chat/completions
Playground에서 테스트문서로 돌아가기