모델 카탈로그

Nano Banana

Google

70 크레딧

멀티모달 편집 기능을 갖춘 Google Gemini 2.5 Flash 기반 이미지 생성 모델입니다. 생성과 편집 작업 모두에 빠르고 다재다능합니다.

Gemini 2.5 Flash 기반 생성

GPT Image 2

OpenAI

480 크레딧

강력한 지시 이해력, 선명한 텍스트 렌더링, 정밀한 편집을 갖춘 OpenAI의 최첨단 이미지 생성/편집 모델입니다. 품질 기반 가격으로 비용-품질 트레이드오프를 선택할 수 있습니다.

뛰어난 프롬프트/지시 이해력

선명한 타이포그래피 및 텍스트 렌더링

input_images로 합성/편집 지원

다양한 시각적 스타일 (실사, 애니메, 3D)

비디오 생성 모델

Kling, MiniMax 등 최신 모델로 AI 비디오를 제작하세요

Seedance 1 Pro Fast

추천

ByteDance

190 크레딧

빠른 생성 속도와 프로페셔널 출력 품질을 갖춘 ByteDance의 시네마틱 비디오 생성 모델입니다.

Google Veo 3.1 Fast

Google

1800 크레딧

오디오 생성 기능을 갖춘 Veo 3.1의 고속 버전으로, 높은 품질을 유지하면서 속도에 최적화되었습니다.

Google Veo 3.1

Google

4800 크레딧

내장 오디오 생성 기능을 갖춘 Google의 최첨단 비디오 생성 모델로, 동기화된 사운드와 함께 시네마틱 품질의 비디오를 생성합니다.

내장 오디오 생성

시네마틱 품질 출력

시작 프레임을 활용한 이미지-비디오 변환

느림울트라

Kling v2.1

Kuaishou

375 크레딧

720p/1080p 지원과 프레임 전환 기능을 갖춘 Kling v2.1로, 부드럽고 고품질의 비디오를 생성합니다.

Kling 2.5 Turbo Pro

Kuaishou

525 크레딧

향상된 모션과 장면 일관성을 갖춘 시네마틱급 비디오 생성 모델입니다. 프로페셔널 출력을 위한 최상위 Kling 모델입니다.

MiniMax Hailuo 2.3 Fast

MiniMax

285 크레딧

인물 모션 비디오의 좋은 품질을 유지하면서 더 빠른 생성을 위해 최적화된 Hailuo 2.3의 저지연 버전입니다.

Hailuo 2.3보다 빠른 생성 속도

MiniMax Hailuo 2.3

MiniMax

420 크레딧

고급 캐릭터 일관성과 자연스러운 움직임을 갖춘 사실적인 인물 모션 비디오 생성 모델입니다.

OpenAI Sora 2

OpenAI

600 크레딧

사실적인 물리 시뮬레이션과 오디오 생성 기능을 갖춘 OpenAI의 비디오 생성 모델로, 높은 일관성의 비디오를 생성합니다.

PixVerse V5

PixVerse

2400 크레딧

특수 효과 기능과 애니메이션 최적화 출력을 갖춘 고급 비디오 생성 모델로, 다양한 시각적 스타일을 지원합니다.

특수 효과 기능

애니메이션 최적화 출력

느림울트라

Wan 2.5 I2V Fast

Alibaba

510 크레딧

Wan 2.5의 고속 이미지-비디오 변형으로, 정지 이미지로부터 빠르게 애니메이션 비디오를 생성합니다.

Wan 2.5 I2V보다 빠른 생성 속도

Wan 2.5 I2V

Alibaba

1500 크레딧

립싱크 지원이 포함된 이미지-비디오 모델로, 정지 이미지를 자연스러운 모션의 사실적인 비디오로 변환합니다.

Wan 2.5 T2V Fast

Alibaba

765 크레딧

Wan 2.5의 고속 텍스트-비디오 생성 변형으로, 좋은 품질의 출력을 유지하면서 속도에 최적화되었습니다.

Wan 2.5 T2V보다 빠른 생성 속도

Wan 2.5 T2V

Alibaba

1500 크레딧

오디오 동기화 지원이 포함된 텍스트-비디오 모델로, 자연스러운 모션과 함께 텍스트 프롬프트로부터 고품질 비디오를 생성합니다.

오디오 & TTS 모델

Text-to-Speech, 음성 클론, 오디오 생성

MiniMax Speech-02-Turbo

추천

MiniMax

108 크레딧

다국어 지원, 감정 음성 제어, 300개 이상의 목소리 옵션을 갖춘 저지연 텍스트-음성 변환 모델입니다.

MiniMax Speech 2.6 HD

MiniMax

180 크레딧

전문 애플리케이션을 위한 미묘한 운율, 자막 내보내기, 프리미엄 음성을 갖춘 스튜디오 품질 다국어 텍스트-음성 변환 모델입니다.

MiniMax Speech 2.6 Turbo

MiniMax

108 크레딧

감정 제어가 가능한 빠른 다국어 텍스트-음성 변환 모델로, 저지연 실시간 애플리케이션에 최적화되어 있습니다.

MiniMax Speech 2.8 HD

MiniMax

180 크레딧

Artificial Analysis Speech Arena 및 Hugging Face TTS Arena 1위. 자동회귀 Transformer + Flow-VAE 디코더 기반 방송 품질 TTS로, 32개 이상 언어, 음성 클론, 자연스러운 감탄사, 감정 제어를 지원합니다.

주요 TTS 벤치마크 1위

스튜디오급 방송 품질 오디오

자연스러운 감탄사 (웃음, 한숨, 기침 등)

MiniMax Speech 2.8 Turbo

MiniMax

108 크레딧

250ms 미만 지연의 저지연 MiniMax Speech 2.8 Turbo. 40개 이상 언어, 음성 클론, 자연스러운 감탄사, 실시간 과금을 지원합니다. 인터랙티브 및 실시간 애플리케이션에 적합합니다.

실시간 사용을 위한 250ms 미만 지연

40개 이상 언어 지원

자연스러운 감탄사 (웃음, 한숨, 기침 등)

Clova Voice TTS Premium

NCP Clova

12.4 크레딧

108개 음성, 6개 언어를 지원하는 네이버 클로바 보이스 프리미엄 TTS. 고품질 한국어 음성 합성, 감정 표현, Pro 음성, 이중 언어 지원.

6개 언어 108개 음성 옵션

고품질 한국어 음성 합성

감정 제어 (중립, 슬픔, 기쁨, 분노)

LLM 모델

GPT-4o, Claude, Gemini - OpenAI 호환 채팅 API

Claude 3.7 Sonnet

추천

Anthropic

향상된 추론 및 코딩 능력을 갖춘 Claude 3.7 Sonnet입니다. 다양한 작업에서 안정적인 성능을 제공하는 강력한 중간 티어 모델입니다.

Claude Haiku 4.5

Anthropic

일상적인 작업을 위한 빠르고 비용 효율적인 모델입니다. 대용량 애플리케이션을 위한 속도, 지능, 비용의 훌륭한 균형을 제공합니다.

Claude Opus 4.5

Anthropic

매우 복잡한 작업을 위한 Anthropic의 가장 강력한 모델입니다. 깊은 전문성이 필요한 연구, 분석 및 창의적 프로젝트에 탁월합니다.

Claude Opus 4.6

Anthropic

Anthropic의 가장 강력한 모델입니다. 향상된 안전성과 지시 따르기 능력으로 추론, 코딩, 복잡한 분석에서 획기적인 성능을 제공합니다.

Claude Opus 4.7

Anthropic

2026년 1월까지의 신뢰할 수 있는 학습 기준일과 128K 최대 출력 토큰을 갖춘 Anthropic의 최신 플래그십 모델입니다. Opus 4.6 대비 추론, 코딩, 지시 따르기 성능이 향상되었으며 Anthropic Messages 및 OpenAI Chat Completions 형식과 호환됩니다.

Claude Sonnet 4.5

Anthropic

4 크레딧

Anthropic의 가장 지능적이고 강력한 Sonnet 모델입니다. 복잡한 추론, 미묘한 이해, 코딩 작업에서 최고 수준이며 뛰어난 지시 따르기 능력을 제공합니다.

Claude Sonnet 4

Anthropic

효율적인 가격대에서 강력한 추론과 코딩 능력을 제공하는 균형 잡힌 Sonnet 4 모델입니다. 속도와 지능의 적절한 조합이 필요한 일상적인 프로덕션 워크로드에 이상적입니다.

Gemini 2.0 Flash Lite

Google

0.5 크레딧

최대 속도와 최소 비용을 위해 최적화된 Gemini 2.0 Flash의 초경량 버전입니다. 대량의 지연에 민감한 애플리케이션에 적합합니다.

초고속 추론

요청당 최소 비용

빠름표준

Gemini 2.0 Flash

Google

Google의 가장 빠르고 강력한 모델입니다. 100만 토큰 컨텍스트 윈도우, 네이티브 멀티모달 지원 및 실시간 기능을 제공합니다.

네이티브 멀티모달 (텍스트·이미지·오디오·비디오)

8,192 최대 출력 토큰

Gemini 2.5 Flash

Google

사고 능력이 내장된 Google의 빠르고 효율적인 모델입니다. 대용량 애플리케이션을 위한 속도, 추론, 비용의 훌륭한 균형을 제공합니다.

멀티모달 입력: 텍스트·이미지·비디오·오디오

Gemini 2.5 Pro

Google

최첨단 추론 능력과 1M 토큰 컨텍스트를 갖춘 Google의 가장 강력한 모델입니다. 복잡한 코딩, 수학, 다중 문서 분석에 탁월합니다.

멀티모달 입력: 오디오·이미지·비디오·텍스트·PDF

Gemini 3 Flash

Google

최첨단 멀티모달 이해력, 박사급 추론 능력, 최고 수준의 코딩 성능을 갖춘 Google의 가장 진보된 추론 모델입니다.

박사급 추론 능력

Gemini 3 Pro Image Preview

Google

Gemini 3 Pro 제품군의 프리미엄 이미지 생성 모델입니다. 채팅에서 직접 최고 충실도의 이미지를 생성합니다. 이미지 출력 토큰은 텍스트 출력 토큰의 10배 가격이 적용됩니다.

Gemini 3 Pro Preview

Google

4 크레딧

Google의 가장 강력한 Gemini 모델 프리뷰 버전입니다. 획기적인 추론, 코딩, 멀티모달 기능과 최대 컨텍스트 윈도우를 제공합니다.

멀티모달 입력: 텍스트·이미지·비디오·오디오·PDF

Gemini 3.1 Flash Image Preview

Google

네이티브 이미지 생성 기능을 갖춘 Gemini 3.1 Flash입니다. 채팅 응답에서 텍스트와 함께 이미지를 직접 생성할 수 있습니다. 텍스트와 이미지 출력 토큰에 별도의 가격이 적용됩니다.

Gemini 3.1 Flash Lite Preview

Google

100 크레딧

Gemini 3.1 Flash의 초경량 변형 모델입니다. 캐시된 입력과 오디오 입력을 지원하는 가장 비용 효율적인 Gemini 모델입니다. 고처리량, 비용 의식적 애플리케이션에 적합합니다.

가장 비용 효율적인 Gemini 모델

빠름표준

Gemini 3.1 Flash Live Preview

Google

300 크레딧

실시간 상호작용 및 라이브 스트리밍 시나리오에 최적화된 Gemini 3.1 Flash입니다. 전용 가격의 오디오 입력 지원과 함께 저지연 응답을 제공합니다.

Live API 지원 (실시간 양방향)

Gemini 3.1 Pro Preview

Google

동적 가격 책정 (표준 / 200K 이상 장문 컨텍스트)

Google의 최신이자 가장 강력한 Gemini 모델 프리뷰입니다. 컨텍스트 길이에 따라 조정되는 동적 가격 책정이 적용되며, 200K 토큰 이상 입력 시 확장 가격이 적용됩니다.

고급 추론 및 분석

출력 차원: 128–3,072 (기본 3,072; 권장 768 / 1,536 / 3,072)

Gemini Embedding 001

Google

0.1 크레딧

벡터 표현 생성을 위한 Google의 텍스트 임베딩 모델입니다. 의미 검색, 클러스터링, 유사도 작업에 최적화되어 있습니다.

고품질 텍스트 임베딩

요청당 최대 입력 2,048 토큰

GPT-4.1 Mini

OpenAI

소형 모델 성능의 획기적 도약. GPT-4o와 동등하거나 뛰어난 지능을 갖추면서 지연 시간은 거의 절반, 비용은 83% 절감. 속도, 품질, 경제성의 이상적 균형.

1M 토큰 컨텍스트 윈도우

32K 최대 출력 토큰

GPT-4o 지능을 훨씬 낮은 비용으로

GPT-4.1 Nano

OpenAI

OpenAI의 가장 빠르고 저렴한 모델. 분류, 자동완성, 저지연 작업에 최적화. $0.10/1M 입력 토큰의 초저가격.

GPT-4.1

OpenAI

OpenAI의 코딩 및 지시 따르기에 가장 뛰어난 모델입니다. 1M 토큰 컨텍스트 윈도우, 32K 출력 토큰을 지원하며, 코딩, 복잡한 프롬프트, 긴 컨텍스트 작업에서 크게 향상되었습니다. GPT-4o 대비 출력 비용 20% 절감.

GPT-4o Mini

OpenAI

비용 효율적이고 빠른 모델로 강력한 성능을 제공합니다. 절대적인 성능보다 속도와 비용이 중요한 대량 작업에 최적입니다.

GPT-4o

OpenAI

네이티브 멀티모달 (텍스트 + 비전 + 오디오)

OpenAI의 플래그십 멀티모달 모델입니다. 추론, 코딩, 창의적 작업에서 업계 최고 성능을 제공하며, 네이티브 비전 기능과 구조화된 출력을 지원합니다.

GPT-5 Mini

OpenAI

GPT-5의 빠르고 효율적인 변형 모델입니다. 1M 토큰 컨텍스트 윈도우와 32K 출력 토큰을 갖추고 GPT-5 대비 훨씬 저렴한 비용으로 추론, 코딩, 창의적 작업 전반에서 우수한 성능을 제공합니다.

GPT-5 Nano

OpenAI

GPT-5의 초고속 경량 변형 모델입니다. 1M 토큰 컨텍스트 윈도우와 32K 출력 토큰을 갖추고 최소 비용으로 고처리량, 저지연 애플리케이션을 위해 설계되었습니다.

GPT-5.1 (2025-11-13)

OpenAI

재현 가능한 결과를 위한 GPT-5.1의 날짜별 스냅샷입니다. 반복 컨텍스트에 대한 캐시된 입력 토큰으로 비용 절감을 지원합니다. 모델 버전 고정이 필요한 프로덕션 배포에 적합합니다.

GPT-5.2

OpenAI

4 크레딧

OpenAI의 최신이자 가장 진보된 GPT 모델입니다. 향상된 기능으로 추론, 코딩, 창의적 작업 전반에서 최첨단 성능을 제공합니다.

GPT-5.4 Mini

OpenAI

2 크레딧

400K 컨텍스트 윈도우와 128K 출력 토큰을 갖춘 GPT-5.4의 빠르고 비용 효율적인 변형 모델입니다. 일상적인 작업에서 성능과 가성비의 탁월한 균형을 제공합니다.

GPT-5.4 Nano

OpenAI

400K 컨텍스트와 128K 출력을 갖춘 초경량 최고속 GPT-5.4 변형 모델입니다. 최소 비용으로 고처리량, 저지연 애플리케이션을 위해 설계되었습니다. 도구 통합을 위한 MCP를 지원합니다.

GPT-5.4

OpenAI

조절 가능한 추론 (none/low/medium/high/xhigh)

1M 컨텍스트 윈도우와 128K 출력 토큰을 갖춘 OpenAI의 최신 플래그십 모델입니다. none부터 xhigh까지 조절 가능한 추론 수준으로 모든 영역에서 최상위 추론 성능을 제공합니다.

1M 토큰 컨텍스트 윈도우

128K 최대 출력 토큰

빠름울트라

GPT-5.5

OpenAI

1.05M 컨텍스트 윈도우와 128K 최대 출력 토큰을 갖춘 OpenAI의 최신 플래그십 모델입니다. 캐시 입력 10배 할인을 지원하며 GPT-5.4 시리즈 대비 추론, 코딩, 멀티모달 성능이 향상되었습니다.

GPT-5

OpenAI

OpenAI의 최신 플래그십 모델입니다. 1M 토큰 컨텍스트 윈도우와 32K 출력 토큰을 갖추고 추론, 코딩, 창의적 작업 전반에서 탁월한 성능을 제공합니다. 비전, 함수 호출, JSON 모드를 지원합니다.

GPT Audio Mini

OpenAI