Skip to main content
Core.Today
|
Google빠름높음

Gemini Embedding 001

벡터 표현 생성을 위한 Google의 텍스트 임베딩 모델입니다. 의미 검색, 클러스터링, 유사도 작업에 최적화되어 있습니다.

0.1 크레딧
1K 토큰당
고품질 텍스트 임베딩
요청당 최대 입력 2,048 토큰
출력 차원: 128–3,072 (기본 3,072; 권장 768 / 1,536 / 3,072)
Matryoshka Representation Learning (MRL) — 유연한 차원 선택
8가지 task_type: SEMANTIC_SIMILARITY, CLASSIFICATION, CLUSTERING, RETRIEVAL_DOCUMENT, RETRIEVAL_QUERY, CODE_RETRIEVAL_QUERY, QUESTION_ANSWERING, FACT_VERIFICATION
의미 검색·클러스터링·분류·RAG에 최적화

지금 바로 실행해보세요

콘솔의 Playground에서 별도 코드 없이 이 모델을 즉시 테스트할 수 있어요

로그인 후 사용해보기

AI 어시스턴트에서 사용하기

이 모델의 사용법을 Claude, ChatGPT 등에 복사

llms.txt

모델 상세 사양

컨텍스트 윈도우
2K
토큰
최대 출력
0
토큰
학습 데이터
August 2024
호환 SDK
Google AI

기능 지원

비전
함수 호출
스트리밍
JSON 모드
시스템 프롬프트

토큰별 가격 (1M 토큰당)

토큰 종류크레딧달러 환산
입력 토큰300$0.30
출력 토큰0$0.00

* 1 크레딧 ≈ $0.001 (실제 요금은 사용량에 따라 달라질 수 있습니다)

빠른 시작

curl -X POST "https://api.core.today/llm/gemini/v1beta/openai/embeddings" \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer cdt_your_api_key" \
  -d '{
  "model": "gemini-embedding-001",
  "input": "What is the meaning of life?"
}'

파라미터

파라미터타입필수기본값설명
inputstring | arrayYes-임베딩할 텍스트 또는 텍스트 배열. 항목당 최대 2,048 입력 토큰.
modelstringYesgemini-embedding-001모델 식별자.
dimensionsintegerNo3072임베딩 출력 차원. 범위: 128–3,072. 권장값: 768, 1,536, 3,072. 3,072 이외의 차원은 L2 정규화를 직접 적용해야 합니다.
task_typestringNo-다운스트림 작업에 맞춰 임베딩을 최적화합니다. SEMANTIC_SIMILARITY, CLASSIFICATION, CLUSTERING, RETRIEVAL_DOCUMENT, RETRIEVAL_QUERY, CODE_RETRIEVAL_QUERY, QUESTION_ANSWERING, FACT_VERIFICATION 중 선택.
SEMANTIC_SIMILARITYCLASSIFICATIONCLUSTERINGRETRIEVAL_DOCUMENTRETRIEVAL_QUERYCODE_RETRIEVAL_QUERYQUESTION_ANSWERINGFACT_VERIFICATION

예제

텍스트 임베딩

의미 검색을 위한 임베딩 생성

curl -X POST "https://api.core.today/llm/gemini/v1beta/openai/embeddings" \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer cdt_your_api_key" \
  -d '{
  "model": "gemini-embedding-001",
  "input": "What is the meaning of life?"
}'

팁 & 모범 사례

1최대 입력: 항목당 2,048 토큰 — 긴 문서는 먼저 청크로 분할하세요
2기본 출력: 3,072 차원. 저장/비용 절감을 위해 MRL로 768·1,536 차원 선택 가능
3use case에 맞춰 `task_type` 설정 (예: 색인은 RETRIEVAL_DOCUMENT, 검색은 RETRIEVAL_QUERY)
43,072 이외 차원을 요청한 경우 L2 정규화를 직접 수행해야 합니다
5RAG 파이프라인을 위해 벡터 데이터베이스와 결합
6효율성을 위해 한 번의 요청에 여러 텍스트를 배치로 전송

사용 사례

의미 검색
문서 클러스터링
유사도 매칭
추천 시스템
RAG (검색 증강 생성)