모델 카탈로그
이미지, 비디오, 오디오 생성 및 LLM을 위한 다양한 AI 모델을 살펴보세요.
추천 모델
각 카테고리의 추천 모델 - 시작하기에 가장 좋은 모델들
FLUX.1 Schnell
Black Forest Labs
속도에 최적화된 초고속 이미지 생성 모델입니다. 1-2초 만에 고품질 이미지를 생성하며, 실시간 애플리케이션과 빠른 프로토타이핑에 적합합니다.
MiniMax Hailuo 2.3
MiniMax
고급 캐릭터 일관성과 자연스러운 움직임을 갖춘 사실적인 인물 모션 비디오 생성 모델입니다.
MiniMax Speech-02-Turbo
MiniMax
다국어 지원, 감정 음성 제어, 300개 이상의 목소리 옵션을 갖춘 저지연 텍스트-음성 변환 모델입니다.
GPT-4o
OpenAI
OpenAI의 플래그십 멀티모달 모델입니다. 추론, 코딩, 창의적 작업에서 업계 최고 성능을 제공하며, 네이티브 비전 기능과 구조화된 출력을 지원합니다.
모델 선택 가이드
속도가 중요하다면?
flux-schnell, Gemini Flash
품질이 중요하다면?
FLUX Pro, Kling Pro, Claude
비용 효율적인 선택?
flux-schnell, MiniMax, Gemini
가장 다재다능한 모델?
GPT-4o, Claude, FLUX Dev
이미지 생성 모델
FLUX, Stable Diffusion 등으로 멋진 이미지를 생성하세요
FLUX.1 Schnell
추천Black Forest Labs
속도에 최적화된 초고속 이미지 생성 모델입니다. 1-2초 만에 고품질 이미지를 생성하며, 실시간 애플리케이션과 빠른 프로토타이핑에 적합합니다.
Seedream 4.0
ByteDance
뛰어난 프롬프트 이해력과 창의적 능력을 갖춘 ByteDance의 최신 이미지 생성 모델입니다.
FLUX 1.1 Pro
Black Forest Labs
FLUX.1 Pro를 업그레이드한 빠르고 고품질 이미지 생성 모델입니다. 속도와 충실도 모두가 필요한 프로덕션 워크로드에 적합합니다.
FLUX.2 Dev
Black Forest Labs
이미지 편집 기능과 참조 이미지 지원이 포함된 FLUX.2 개발 버전입니다. 반복적인 디자인 워크플로우와 실험에 이상적입니다.
FLUX 2 Flex
Black Forest Labs
최대 10개의 참조 이미지와 고급 타이포그래피를 지원하는 최고 품질 FLUX 모델입니다. 복잡한 다중 참조 크리에이티브 프로젝트에 가장 강력한 모델입니다.
FLUX 2 Pro
Black Forest Labs
고품질 편집 기능과 최대 8개의 참조 이미지를 지원하는 프로페셔널 FLUX 2 모델입니다. 품질, 속도, 크리에이티브 제어의 뛰어난 균형을 제공합니다.
FLUX.1 Krea [dev]
Krea AI
'AI 느낌'을 특별히 배제하여 실제 사진과 구별할 수 없는 자연스러운 이미지를 생성하는 포토리얼리스틱 이미지 생성 모델입니다.
Nano Banana
멀티모달 편집 기능을 갖춘 Google Gemini 2.5 Flash 기반 이미지 생성 모델입니다. 생성과 편집 작업 모두에 빠르고 다재다능합니다.
Nano Banana Pro (Gemini 3 Pro Image)
Gemini 3 Pro 기반의 Google 최첨단 이미지 생성 및 편집 모델입니다. 다국어 텍스트 렌더링, Google 검색을 통한 실시간 정보 연동, 전문가급 크리에이티브 제어 기능을 제공합니다. 최대 14장의 참조 이미지와 4K 해상도를 지원합니다.
Nano Banana 2 (Gemini 3.1 Flash Image)
Gemini 3.1 Flash Image 기반의 Google 고속 이미지 생성 모델입니다. Nano Banana Pro의 고효율 버전으로, Pro급 시각 품질을 Flash 속도와 가격으로 제공합니다. 대화형 편집, 다중 이미지 융합, 캐릭터 일관성, 정확한 텍스트 렌더링, Google 검색 연동을 지원합니다. 최대 14장의 참조 이미지와 4K 해상도를 지원합니다.
Remove Background
Bria AI
AI 기반 이미지 배경 제거 도구입니다. 전문적인 수준의 엣지 감지로 모든 피사체에 대해 깔끔하고 정확한 컷아웃을 제공합니다.
비디오 생성 모델
Kling, MiniMax 등 최신 모델로 AI 비디오를 제작하세요
Google Veo 3.1
추천내장 오디오 생성 기능을 갖춘 Google의 최첨단 비디오 생성 모델로, 동기화된 사운드와 함께 시네마틱 품질의 비디오를 생성합니다.
Google Veo 3.1 Fast
오디오 생성 기능을 갖춘 Veo 3.1의 고속 버전으로, 높은 품질을 유지하면서 속도에 최적화되었습니다.
OpenAI Sora 2
OpenAI
사실적인 물리 시뮬레이션과 오디오 생성 기능을 갖춘 OpenAI의 비디오 생성 모델로, 높은 일관성의 비디오를 생성합니다.
Kling v2.1
Kuaishou
720p/1080p 지원과 프레임 전환 기능을 갖춘 Kling v2.1로, 부드럽고 고품질의 비디오를 생성합니다.
Kling 2.5 Turbo Pro
Kuaishou
향상된 모션과 장면 일관성을 갖춘 시네마틱급 비디오 생성 모델입니다. 프로페셔널 출력을 위한 최상위 Kling 모델입니다.
MiniMax Hailuo 2.3
MiniMax
고급 캐릭터 일관성과 자연스러운 움직임을 갖춘 사실적인 인물 모션 비디오 생성 모델입니다.
MiniMax Hailuo 2.3 Fast
MiniMax
인물 모션 비디오의 좋은 품질을 유지하면서 더 빠른 생성을 위해 최적화된 Hailuo 2.3의 저지연 버전입니다.
PixVerse V5
PixVerse
특수 효과 기능과 애니메이션 최적화 출력을 갖춘 고급 비디오 생성 모델로, 다양한 시각적 스타일을 지원합니다.
Wan 2.5 T2V
Alibaba
오디오 동기화 지원이 포함된 텍스트-비디오 모델로, 자연스러운 모션과 함께 텍스트 프롬프트로부터 고품질 비디오를 생성합니다.
Wan 2.5 T2V Fast
Alibaba
Wan 2.5의 고속 텍스트-비디오 생성 변형으로, 좋은 품질의 출력을 유지하면서 속도에 최적화되었습니다.
Wan 2.5 I2V
Alibaba
립싱크 지원이 포함된 이미지-비디오 모델로, 정지 이미지를 자연스러운 모션의 사실적인 비디오로 변환합니다.
Wan 2.5 I2V Fast
Alibaba
Wan 2.5의 고속 이미지-비디오 변형으로, 정지 이미지로부터 빠르게 애니메이션 비디오를 생성합니다.
Seedance 1 Pro Fast
ByteDance
빠른 생성 속도와 프로페셔널 출력 품질을 갖춘 ByteDance의 시네마틱 비디오 생성 모델입니다.
오디오 & TTS 모델
Text-to-Speech, 음성 클론, 오디오 생성
Clova Voice TTS Premium
추천NCP Clova
108개 음성, 6개 언어를 지원하는 네이버 클로바 보이스 프리미엄 TTS. 고품질 한국어 음성 합성, 감정 표현, Pro 음성, 이중 언어 지원.
MiniMax Speech-02-Turbo
MiniMax
다국어 지원, 감정 음성 제어, 300개 이상의 목소리 옵션을 갖춘 저지연 텍스트-음성 변환 모델입니다.
MiniMax Speech 2.6 HD
MiniMax
전문 애플리케이션을 위한 미묘한 운율, 자막 내보내기, 프리미엄 음성을 갖춘 스튜디오 품질 다국어 텍스트-음성 변환 모델입니다.
MiniMax Speech 2.6 Turbo
MiniMax
감정 제어가 가능한 빠른 다국어 텍스트-음성 변환 모델로, 저지연 실시간 애플리케이션에 최적화되어 있습니다.
MiniMax Speech 2.8 HD
MiniMax
Artificial Analysis Speech Arena 및 Hugging Face TTS Arena 1위. 자동회귀 Transformer + Flow-VAE 디코더 기반 방송 품질 TTS로, 32개 이상 언어, 음성 클론, 자연스러운 감탄사, 감정 제어를 지원합니다.
MiniMax Speech 2.8 Turbo
MiniMax
250ms 미만 지연의 저지연 MiniMax Speech 2.8 Turbo. 40개 이상 언어, 음성 클론, 자연스러운 감탄사, 실시간 과금을 지원합니다. 인터랙티브 및 실시간 애플리케이션에 적합합니다.
LLM 모델
GPT-4o, Claude, Gemini - OpenAI 호환 채팅 API
GPT-4o
추천OpenAI
OpenAI의 플래그십 멀티모달 모델입니다. 추론, 코딩, 창의적 작업에서 업계 최고 성능을 제공하며, 네이티브 비전 기능과 구조화된 출력을 지원합니다.
GPT-4.1
OpenAI
OpenAI의 코딩 및 지시 따르기에 가장 뛰어난 모델입니다. 1M 토큰 컨텍스트 윈도우, 32K 출력 토큰을 지원하며, 코딩, 복잡한 프롬프트, 긴 컨텍스트 작업에서 크게 향상되었습니다. GPT-4o 대비 출력 비용 20% 절감.
GPT-4.1 Mini
OpenAI
소형 모델 성능의 획기적 도약. GPT-4o와 동등하거나 뛰어난 지능을 갖추면서 지연 시간은 거의 절반, 비용은 83% 절감. 속도, 품질, 경제성의 이상적 균형.
GPT-4.1 Nano
OpenAI
OpenAI의 가장 빠르고 저렴한 모델. 분류, 자동완성, 저지연 작업에 최적화. $0.10/1M 입력 토큰의 초저가격.
GPT-4o Mini
OpenAI
비용 효율적이고 빠른 모델로 강력한 성능을 제공합니다. 절대적인 성능보다 속도와 비용이 중요한 대량 작업에 최적입니다.
OpenAI o1
OpenAI
OpenAI의 가장 고급 추론 모델입니다. 확장된 사고 시간을 사용하여 과학, 코딩, 수학의 복잡한 문제를 뛰어난 정확도로 해결합니다.
OpenAI o4-mini
OpenAI
코딩 및 STEM 작업에 최적화된 빠르고 비용 효율적인 추론 모델입니다. 대형 추론 모델 대비 매우 낮은 비용으로 강력한 추론을 제공합니다.
OpenAI o3-mini
OpenAI
낮은 비용으로 강력한 성능을 제공하는 효율적인 추론 모델입니다. 대형 모델의 오버헤드 없이 추론이 필요한 작업에 이상적입니다.
GPT-5
OpenAI
OpenAI의 최신 플래그십 모델입니다. 1M 토큰 컨텍스트 윈도우와 32K 출력 토큰을 갖추고 추론, 코딩, 창의적 작업 전반에서 탁월한 성능을 제공합니다. 비전, 함수 호출, JSON 모드를 지원합니다.
GPT-5.2
OpenAI
OpenAI의 최신이자 가장 진보된 GPT 모델입니다. 향상된 기능으로 추론, 코딩, 창의적 작업 전반에서 최첨단 성능을 제공합니다.
GPT-5 Mini
OpenAI
GPT-5의 빠르고 효율적인 변형 모델입니다. 1M 토큰 컨텍스트 윈도우와 32K 출력 토큰을 갖추고 GPT-5 대비 훨씬 저렴한 비용으로 추론, 코딩, 창의적 작업 전반에서 우수한 성능을 제공합니다.
GPT-5 Nano
OpenAI
GPT-5의 초고속 경량 변형 모델입니다. 1M 토큰 컨텍스트 윈도우와 32K 출력 토큰을 갖추고 최소 비용으로 고처리량, 저지연 애플리케이션을 위해 설계되었습니다.
GPT Audio Mini
OpenAI
네이티브 오디오 입출력 기능을 갖춘 경량 멀티모달 모델입니다. 음성 기반 상호작용 및 오디오 처리 작업에 최적화되어 있습니다.
Claude Opus 4.6
Anthropic
Anthropic의 가장 강력한 모델입니다. 향상된 안전성과 지시 따르기 능력으로 추론, 코딩, 복잡한 분석에서 획기적인 성능을 제공합니다.
Claude Sonnet 4.5
Anthropic
Anthropic의 가장 지능적이고 강력한 Sonnet 모델입니다. 복잡한 추론, 미묘한 이해, 코딩 작업에서 최고 수준이며 뛰어난 지시 따르기 능력을 제공합니다.
Claude Opus 4.5
Anthropic
매우 복잡한 작업을 위한 Anthropic의 가장 강력한 모델입니다. 깊은 전문성이 필요한 연구, 분석 및 창의적 프로젝트에 탁월합니다.
Claude Haiku 4.5
Anthropic
일상적인 작업을 위한 빠르고 비용 효율적인 모델입니다. 대용량 애플리케이션을 위한 속도, 지능, 비용의 훌륭한 균형을 제공합니다.
Claude Sonnet 4
Anthropic
효율적인 가격대에서 강력한 추론과 코딩 능력을 제공하는 균형 잡힌 Sonnet 4 모델입니다. 속도와 지능의 적절한 조합이 필요한 일상적인 프로덕션 워크로드에 이상적입니다.
Claude 3.7 Sonnet
Anthropic
향상된 추론 및 코딩 능력을 갖춘 Claude 3.7 Sonnet입니다. 다양한 작업에서 안정적인 성능을 제공하는 강력한 중간 티어 모델입니다.
GPT-5.4
OpenAI
1M 컨텍스트 윈도우와 128K 출력 토큰을 갖춘 OpenAI의 최신 플래그십 모델입니다. none부터 xhigh까지 조절 가능한 추론 수준으로 모든 영역에서 최상위 추론 성능을 제공합니다.
GPT-5.4 Mini
OpenAI
400K 컨텍스트 윈도우와 128K 출력 토큰을 갖춘 GPT-5.4의 빠르고 비용 효율적인 변형 모델입니다. 일상적인 작업에서 성능과 가성비의 탁월한 균형을 제공합니다.
GPT-5.4 Nano
OpenAI
400K 컨텍스트와 128K 출력을 갖춘 초경량 최고속 GPT-5.4 변형 모델입니다. 최소 비용으로 고처리량, 저지연 애플리케이션을 위해 설계되었습니다. 도구 통합을 위한 MCP를 지원합니다.
GPT-5.1 (2025-11-13)
OpenAI
재현 가능한 결과를 위한 GPT-5.1의 날짜별 스냅샷입니다. 반복 컨텍스트에 대한 캐시된 입력 토큰으로 비용 절감을 지원합니다. 모델 버전 고정이 필요한 프로덕션 배포에 적합합니다.
Gemini 3 Pro Preview
Google의 가장 강력한 Gemini 모델 프리뷰 버전입니다. 획기적인 추론, 코딩, 멀티모달 기능과 최대 컨텍스트 윈도우를 제공합니다.
Gemini 2.0 Flash Lite
최대 속도와 최소 비용을 위해 최적화된 Gemini 2.0 Flash의 초경량 버전입니다. 대량의 지연에 민감한 애플리케이션에 적합합니다.
Gemini Embedding 001
벡터 표현 생성을 위한 Google의 텍스트 임베딩 모델입니다. 의미 검색, 클러스터링, 유사도 작업에 최적화되어 있습니다.
Gemini 2.0 Flash
Google의 가장 빠르고 강력한 모델입니다. 100만 토큰 컨텍스트 윈도우, 네이티브 멀티모달 지원 및 실시간 기능을 제공합니다.
Gemini 2.5 Flash
사고 능력이 내장된 Google의 빠르고 효율적인 모델입니다. 대용량 애플리케이션을 위한 속도, 추론, 비용의 훌륭한 균형을 제공합니다.
Gemini 2.5 Pro
최첨단 추론 능력과 1M 토큰 컨텍스트를 갖춘 Google의 가장 강력한 모델입니다. 복잡한 코딩, 수학, 다중 문서 분석에 탁월합니다.
Gemini 3 Flash
최첨단 멀티모달 이해력, 박사급 추론 능력, 최고 수준의 코딩 성능을 갖춘 Google의 가장 진보된 추론 모델입니다.
Gemini 3.1 Pro Preview
Google의 최신이자 가장 강력한 Gemini 모델 프리뷰입니다. 컨텍스트 길이에 따라 조정되는 동적 가격 책정이 적용되며, 200K 토큰 이상 입력 시 확장 가격이 적용됩니다.
Gemini 3.1 Flash Image Preview
네이티브 이미지 생성 기능을 갖춘 Gemini 3.1 Flash입니다. 채팅 응답에서 텍스트와 함께 이미지를 직접 생성할 수 있습니다. 텍스트와 이미지 출력 토큰에 별도의 가격이 적용됩니다.
Gemini 3.1 Flash Lite Preview
Gemini 3.1 Flash의 초경량 변형 모델입니다. 캐시된 입력과 오디오 입력을 지원하는 가장 비용 효율적인 Gemini 모델입니다. 고처리량, 비용 의식적 애플리케이션에 적합합니다.
Gemini 3.1 Flash Live Preview
실시간 상호작용 및 라이브 스트리밍 시나리오에 최적화된 Gemini 3.1 Flash입니다. 전용 가격의 오디오 입력 지원과 함께 저지연 응답을 제공합니다.
Gemini 3 Pro Image Preview
Gemini 3 Pro 제품군의 프리미엄 이미지 생성 모델입니다. 채팅에서 직접 최고 충실도의 이미지를 생성합니다. 이미지 출력 토큰은 텍스트 출력 토큰의 10배 가격이 적용됩니다.
가격 비교
모든 모델의 크레딧 비용을 비교하여 최적의 모델을 선택하세요
| 카테고리 | 모델 | 크레딧 | 단위 | 추천 용도 |
|---|---|---|---|---|
| 이미지 | flux-schnell | 5 | 이미지당 | 빠른 생성, 실시간 앱 |
| flux-2-pro | 100 | 이미지당 | 최고 품질, 상업용 | |
| seedream-4 | 59 | 이미지당 | 텍스트 렌더링, 로고 | |
| 비디오 | kling-v2.5-turbo-pro | 525 | 비디오당 | 최고 품질 비디오 |
| hailuo-2.3 | 420 | 비디오당 | 고품질, 균형 잡힌 | |
| 오디오 | speech-02-turbo | 108 | 요청당 | 실시간 TTS, 빠른 응답 |
| speech-2.6-hd | 180 | 요청당 | 고품질 HD 음성 | |
| LLM | gpt-4o | 3 | 1K토큰당 | 범용, 코드, 멀티모달 |
| claude-sonnet-4-5 | 4 | 1K토큰당 | 분석, 장문, 코드 | |
| gemini-2.0-flash | 1 | 1K토큰당 | 초고속, 대량 처리 |
시작할 준비가 되셨나요?
Playground에서 모델을 테스트하거나 빠른 시작 가이드를 따라해보세요