소형 모델 성능의 획기적 도약. GPT-4o와 동등하거나 뛰어난 지능을 갖추면서 지연 시간은 거의 절반, 비용은 83% 절감. 속도, 품질, 경제성의 이상적 균형.
이 모델의 사용법을 Claude, ChatGPT 등에 복사
| 토큰 종류 | 크레딧 | 달러 환산 |
|---|---|---|
| 입력 토큰 | 400 | $0.40 |
| 출력 토큰 | 1,600 | $1.60 |
| 캐시된 토큰 | 100 | $0.10 |
* 1 크레딧 ≈ $0.001 (실제 요금은 사용량에 따라 달라질 수 있습니다)
curl -X POST "https://api.core.today/llm/openai/v1/chat/completions" \
-H "Content-Type: application/json" \
-H "Authorization: Bearer cdt_your_api_key" \
-d '{
"model": "gpt-4.1-mini",
"messages": [
{
"role": "system",
"content": "You are a helpful assistant. Be concise."
},
{
"role": "user",
"content": "What are the top 3 design patterns for microservices?"
}
],
"temperature": 0.7,
"max_tokens": 1000
}'| 파라미터 | 타입 | 필수 | 기본값 | 설명 |
|---|---|---|---|---|
messages | array | Yes | - | role과 content를 포함한 메시지 객체 배열 |
model | string | Yes | gpt-4.1-mini | 모델 식별자 |
temperature | float | No | 1.0 | 샘플링 온도 (0-2). 낮을수록 집중적, 높을수록 창의적 |
max_tokens | integer | No | 4096 | 응답의 최대 토큰 수 (최대 32768) |
stream | boolean | No | false | Server-Sent Events 스트리밍 활성화 |
response_format | object | No | - | 응답 형식: JSON 모드의 경우 { type: 'json_object' } |
tools | array | No | - | 모델이 호출할 수 있는 도구(함수) 목록 |
top_p | float | No | 1.0 | 핵 샘플링 임계값 (0-1) |
빠르고 경제적인 대화
curl -X POST "https://api.core.today/llm/openai/v1/chat/completions" \
-H "Content-Type: application/json" \
-H "Authorization: Bearer cdt_your_api_key" \
-d '{
"model": "gpt-4.1-mini",
"messages": [
{
"role": "system",
"content": "You are a helpful assistant. Be concise."
},
{
"role": "user",
"content": "What are the top 3 design patterns for microservices?"
}
],
"temperature": 0.7,
"max_tokens": 1000
}'대규모 콘텐츠 분류 및 태깅
curl -X POST "https://api.core.today/llm/openai/v1/chat/completions" \
-H "Content-Type: application/json" \
-H "Authorization: Bearer cdt_your_api_key" \
-d '{
"model": "gpt-4.1-mini",
"messages": [
{
"role": "system",
"content": "Classify the given text into categories. Respond with JSON."
},
{
"role": "user",
"content": "Classify this support ticket: 'My payment was charged twice and I need a refund for the duplicate charge'"
}
],
"response_format": {
"type": "json_object"
},
"max_tokens": 200
}'POST /llm/openai/v1/chat/completions