LLM API
OpenAI, Anthropic, Google의 대화형 AI 모델을 동일한 API 키로 사용합니다. 기존 OpenAI SDK와 100% 호환됩니다.
주요 모델 상세 정보
각 모델의 상세한 파라미터, 예제 코드, 활용 팁을 확인하세요.
GPT-4o
OpenAI
OpenAI의 플래그십 멀티모달 모델입니다. 추론, 코딩, 창의적 작업에서 업계 최고 성능을 제공하며, 네이티브 비전 기능과 구조화된 출력을 지원합니다.
GPT-4o Mini
OpenAI
비용 효율적이고 빠른 모델로 강력한 성능을 제공합니다. 절대적인 성능보다 속도와 비용이 중요한 대량 작업에 최적입니다.
OpenAI o1
OpenAI
OpenAI의 가장 고급 추론 모델입니다. 확장된 사고 시간을 사용하여 과학, 코딩, 수학의 복잡한 문제를 뛰어난 정확도로 해결합니다.
OpenAI o1-mini
OpenAI
코딩 및 STEM 작업에 최적화된 빠른 추론 모델입니다. o1보다 낮은 비용으로 강력한 추론을 제공합니다.
Claude 3.5 Sonnet
Anthropic
Anthropic의 가장 지능적인 모델입니다. 복잡한 추론, 미묘한 이해, 코딩 작업에서 최고 수준이며 뛰어난 지시 따르기 능력을 제공합니다.
Claude 3 Opus
Anthropic
매우 복잡한 작업을 위한 Anthropic의 가장 강력한 모델입니다. 깊은 전문성이 필요한 연구, 분석 및 창의적 프로젝트에 탁월합니다.
Claude 3.5 Haiku
Anthropic
일상적인 작업을 위한 빠르고 비용 효율적인 모델입니다. 대용량 애플리케이션을 위한 속도, 지능, 비용의 훌륭한 균형을 제공합니다.
Gemini 2.0 Flash
Google의 가장 빠르고 강력한 모델입니다. 100만 토큰 컨텍스트 윈도우, 네이티브 멀티모달 지원 및 실시간 기능을 제공합니다.
Gemini 2.0 Flash Thinking
명시적 사고 과정을 가진 실험적 추론 모델입니다. 복잡한 문제에 대해 단계별 추론을 보여줍니다.
Gemini 1.5 Pro
성능과 비용의 훌륭한 균형을 갖춘 Google의 프로덕션 레디 모델입니다. 대량 문서 처리를 위한 2M 토큰 컨텍스트 윈도우를 제공합니다.
가격 단위: 크레딧/토큰 기준입니다. 예: 1,000 토큰 입력, 500 토큰 출력 시 gpt-4o-mini는 0.3 + 0.6 = 0.9 크레딧
GPT-5 / O-Series 주의사항
GPT-5, o1, o3 등 추론(Reasoning) 모델은 일반 모델과 파라미터가 다릅니다:
max_tokens→max_completion_tokens사용temperature,top_p지원 안 함- 새 파라미터:
reasoning_effort(minimal/low/medium/high)
OpenAI (GPT)
GPT-4o / GPT-4.1 (일반 모델)
curl -X POST https://api.core.today/llm/openai/v1/chat/completions \
-H "Content-Type: application/json" \
-H "Authorization: Bearer cdt_your_api_key" \
-d '{
"model": "gpt-4o",
"messages": [{"role": "user", "content": "Hello!"}],
"max_tokens": 1000,
"temperature": 0.7
}'GPT-5 / O-Series (추론 모델)
curl -X POST https://api.core.today/llm/openai/v1/chat/completions \
-H "Content-Type: application/json" \
-H "Authorization: Bearer cdt_your_api_key" \
-d '{
"model": "gpt-5",
"messages": [{"role": "user", "content": "Explain quantum computing"}],
"max_completion_tokens": 16000,
"reasoning_effort": "medium"
}'GPT-5 전용 파라미터
max_completion_tokens- 최대 출력 토큰 (max_tokens 대신 사용)reasoning_effort- 추론 수준: minimal, low, medium, high
GPT-5 시리즈
| 모델 | Input | Output |
|---|---|---|
| gpt-5 | 0.0025 | 0.0200 |
| gpt-5-mini | 0.0005 | 0.0040 |
| gpt-5-nano | 0.0001 | 0.0008 |
| gpt-5-pro | 0.0300 | 0.2400 |
GPT-4.1 / GPT-4o 시리즈
| 모델 | Input | Output |
|---|---|---|
| gpt-4.1 | 0.0040 | 0.0160 |
| gpt-4.1-mini | 0.0008 | 0.0032 |
| gpt-4.1-nano | 0.0002 | 0.0008 |
| gpt-4o | 0.0050 | 0.0200 |
| gpt-4o-mini | 0.0003 | 0.0012 |
O-Series (Reasoning)
| 모델 | Input | Output |
|---|---|---|
| o1 | 0.0300 | 0.1200 |
| o1-pro | 0.3000 | 1.2000 |
| o3 | 0.0040 | 0.0160 |
| o3-pro | 0.0400 | 0.1600 |
| o4-mini | 0.0022 | 0.0088 |
Anthropic (Claude)
curl -X POST https://api.core.today/llm/anthropic/v1/messages \
-H "Content-Type: application/json" \
-H "Authorization: Bearer cdt_your_api_key" \
-d '{
"model": "claude-sonnet-4",
"max_tokens": 1024,
"messages": [
{"role": "user", "content": "Explain quantum computing simply."}
]
}'Claude Opus 시리즈
| 모델 | Input | Output |
|---|---|---|
| claude-opus-4.5 | 0.0100 | 0.0500 |
| claude-opus-4.1 | 0.0300 | 0.1500 |
| claude-opus-4 | 0.0300 | 0.1500 |
| claude-3-opus | 0.0300 | 0.1500 |
Claude Sonnet 시리즈
| 모델 | Input | Output |
|---|---|---|
| claude-sonnet-4.5 | 0.0060 | 0.0300 |
| claude-sonnet-4 | 0.0060 | 0.0300 |
| claude-3.7-sonnet | 0.0060 | 0.0300 |
| claude-3.5-sonnet | 0.0060 | 0.0300 |
Claude Haiku 시리즈
| 모델 | Input | Output |
|---|---|---|
| claude-haiku-4.5 | 0.0020 | 0.0100 |
| claude-3.5-haiku | 0.0016 | 0.0080 |
| claude-3-haiku | 0.0005 | 0.0025 |
Google (Gemini)
curl -X POST "https://api.core.today/llm/gemini/v1beta/models/gemini-2.5-pro:generateContent" \
-H "Content-Type: application/json" \
-H "Authorization: Bearer cdt_your_api_key" \
-d '{
"contents": [
{
"parts": [{"text": "Write a haiku about programming"}]
}
]
}'Gemini 모델
| 모델 | Input | Output |
|---|---|---|
| gemini-2.5-pro | 0.0025 | 0.0200 |
| gemini-2.5-flash | 0.0006 | 0.0050 |
| gemini-2.5-flash-lite | 0.0002 | 0.0008 |
| gemini-2.0-flash | 0.0002 | 0.0008 |
| gemini-2.0-flash-live | 0.0007 | 0.0030 |
스트리밍 응답
실시간으로 응답을 받으려면 stream: true를 추가하세요:
curl -X POST https://api.core.today/llm/openai/v1/chat/completions \
-H "Content-Type: application/json" \
-H "Authorization: Bearer cdt_your_api_key" \
-d '{
"model": "gpt-5",
"messages": [{"role": "user", "content": "Tell me a long story"}],
"stream": true
}'비용 계산 예시
1,000 토큰 입력, 500 토큰 출력 기준:
| 모델 | 계산 | 총 비용 |
|---|---|---|
| gpt-4o-mini | 0.3 + 0.6 | 0.9 크레딧 |
| gpt-5 | 2.5 + 10.0 | 12.5 크레딧 |
| claude-3-haiku | 0.5 + 1.25 | 1.75 크레딧 |
| claude-sonnet-4 | 6.0 + 15.0 | 21.0 크레딧 |
| gemini-2.0-flash | 0.2 + 0.4 | 0.6 크레딧 |