Google빠름높음

Gemini Embedding 001

벡터 표현 생성을 위한 Google의 텍스트 임베딩 모델입니다. 의미 검색, 클러스터링, 유사도 작업에 최적화되어 있습니다.

0.1 크레딧

1K 토큰당

고품질 텍스트 임베딩

요청당 최대 입력 2,048 토큰

출력 차원: 128–3,072 (기본 3,072; 권장 768 / 1,536 / 3,072)

Matryoshka Representation Learning (MRL) — 유연한 차원 선택

8가지 task_type: SEMANTIC_SIMILARITY, CLASSIFICATION, CLUSTERING, RETRIEVAL_DOCUMENT, RETRIEVAL_QUERY, CODE_RETRIEVAL_QUERY, QUESTION_ANSWERING, FACT_VERIFICATION

의미 검색·클러스터링·분류·RAG에 최적화

지금 바로 실행해보세요

콘솔의 Playground에서 별도 코드 없이 이 모델을 즉시 테스트할 수 있어요

로그인 후 사용해보기

AI 어시스턴트에서 사용하기

이 모델의 사용법을 Claude, ChatGPT 등에 복사

llms.txt

모델 상세 사양

컨텍스트 윈도우

토큰

최대 출력

토큰

학습 데이터

August 2024

호환 SDK

Google AI

기능 지원

비전

함수 호출

스트리밍

JSON 모드

시스템 프롬프트

토큰별 가격 (1M 토큰당)

토큰 종류	크레딧	달러 환산
입력 토큰	300	$0.30
출력 토큰	0	$0.00

* 1 크레딧 ≈ $0.001 (실제 요금은 사용량에 따라 달라질 수 있습니다)

빠른 시작

curl -X POST "https://api.core.today/llm/gemini/v1beta/openai/embeddings" \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer cdt_your_api_key" \
  -d '{
  "model": "gemini-embedding-001",
  "input": "What is the meaning of life?"
}'

파라미터

파라미터	타입	필수	기본값	설명
`input`	string \| array	Yes	-	임베딩할 텍스트 또는 텍스트 배열. 항목당 최대 2,048 입력 토큰.
`model`	string	Yes	gemini-embedding-001	모델 식별자.
`dimensions`	integer	No	3072	임베딩 출력 차원. 범위: 128–3,072. 권장값: 768, 1,536, 3,072. 3,072 이외의 차원은 L2 정규화를 직접 적용해야 합니다.
`task_type`	string	No	-	다운스트림 작업에 맞춰 임베딩을 최적화합니다. SEMANTIC_SIMILARITY, CLASSIFICATION, CLUSTERING, RETRIEVAL_DOCUMENT, RETRIEVAL_QUERY, CODE_RETRIEVAL_QUERY, QUESTION_ANSWERING, FACT_VERIFICATION 중 선택. SEMANTIC_SIMILARITYCLASSIFICATIONCLUSTERINGRETRIEVAL_DOCUMENTRETRIEVAL_QUERYCODE_RETRIEVAL_QUERYQUESTION_ANSWERINGFACT_VERIFICATION

예제

텍스트 임베딩

의미 검색을 위한 임베딩 생성

curl -X POST "https://api.core.today/llm/gemini/v1beta/openai/embeddings" \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer cdt_your_api_key" \
  -d '{
  "model": "gemini-embedding-001",
  "input": "What is the meaning of life?"
}'

팁 & 모범 사례

1최대 입력: 항목당 2,048 토큰 — 긴 문서는 먼저 청크로 분할하세요

2기본 출력: 3,072 차원. 저장/비용 절감을 위해 MRL로 768·1,536 차원 선택 가능

3use case에 맞춰 `task_type` 설정 (예: 색인은 RETRIEVAL_DOCUMENT, 검색은 RETRIEVAL_QUERY)

43,072 이외 차원을 요청한 경우 L2 정규화를 직접 수행해야 합니다

5RAG 파이프라인을 위해 벡터 데이터베이스와 결합

6효율성을 위해 한 번의 요청에 여러 텍스트를 배치로 전송

사용 사례

의미 검색

문서 클러스터링

유사도 매칭

모델 정보

제공자Google

버전001

카테고리LLM

가격0.1 크레딧

API Endpoint

POST /llm/gemini/v1beta/openai/embeddings

Playground에서 테스트