AI 모델 컬렉션

AI 모델 둘러보기

다양한 AI 모델의 특징을 한눈에 비교하고, 나에게 딱 맞는 모델을 찾아보세요.

🤖256개 모델 컬렉션
🔍

카테고리 선택

← 좌우로 스크롤하여 카테고리를 선택하세요 →
🧠

Large Language Models

대규모 언어 모델 - 텍스트 생성, 대화, 번역

131모델
2026-01-19업데이트
🧠

LLM 모델 목록

131개 모델 표시 중
모델명버전파라미터
(활성 / 전체)
특징비전
고급
추론
심화
리서치
비용기업제공
ChatGPT
GPT-5.2-pro
-
대규모 문맥 처리와 심층 추론을 기반으로 고난도 분석·전문 문서 작성·복합 문제 해결에 최적화된 플래그십급 모델.
OO유료
OpenAI
웹 플랫폼모바일앱API
GPT-5.2-thinking
-
장기 문맥 이해와 단계적 사고를 중심으로 논리적 추론·문제 해결·코드 및 데이터 분석 작업에 균형 잡힌 성능을 제공하는 추론 특화 모델.
OO유료
OpenAI
웹 플랫폼모바일앱API
GPT-5.2-instant
-
빠른 응답 속도와 효율적인 처리에 중점을 두어 일상 질의·간단한 생성·경량 작업에 적합한 고속 응답형 모델.
OO조건부 무료
OpenAI
웹 플랫폼모바일앱API
GPT-5.1-thinking
-
적응형 사고 기반의 심층 추론·단계별 분석·사례 생성·복잡한 문제 해결·고정밀 판단에 최적화된 고난도 작업 모델.
OO유료
OpenAI
웹 플랫폼모바일앱API
GPT-5.1-instant
-
즉각 응답 기반의 대화 이해·지시 이행·경량 추론·핵심 정보 요약·실시간 상호작용에 최적화된 고속 처리 모델.
OO유료
OpenAI
웹 플랫폼모바일앱API
GPT-5 Pro
-
대규모 컨텍스트 처리와 멀티모달(텍스트·이미지) 입력을 지원하는 고성능 모델로, GPT-4o Pro 대비 정확도·추론력·응답 품질이 향상됨.
OO유료
OpenAI
GPT-5 Codex
-
GPT-5 기반 코딩 전용 모델로, 코드 작성·리팩토링·테스트·리뷰까지 수행하는 AI 에이전트. 프로젝트 전반의 맥락 이해와 자율적 문제 해결 능력을 갖춤.
OO유료
OpenAI
GPT-5
-
전문 지식 이해와 복잡한 추론, 수학 문제 해결에서 최고 수준의 성능을 갖춘 차세대 멀티모달 모델
OO유료
OpenAI
웹 플랫폼모바일앱API
o4-mini
-
고급 언어 추론과 멀티모달 처리에 최적화
OO유료
OpenAI
ChatGPT 웹모바일앱API
o3-pro
-
정밀한 텍스트 응답과 고급 추론에 특화된 프리미엄 모델
OO유료
OpenAI
o3
-
복잡한 추론과 문제 해결에 강한 모델
OO유료
OpenAI
ChatGPT 웹모바일앱API
o3-deep-research
-
장시간 복잡한 문제를 다룰 수 있는 고성능 심층 리서치 전용 에이전트형 모델
OOO유료
OpenAI
o4-mini-deep-research
-
빠른 응답과 비용 효율성을 갖춘 경량화된 고정밀 심층 리서치 모델
OO유료
OpenAI
GPT-4.5
-
콘텐츠 작성과 아이디어 기획에 유용한 모델
O유료
OpenAI
-
GPT-4.1
-
코딩 및 분석 작업에 최적화된 고속 모델
O조건부 무료
OpenAI
ChatGPT 웹모바일앱API
GPT-4.1-mini
-
일상적 질문과 문서 작업에 최적화된 경량 모델
O유료
OpenAI
GPT-4o
-
문서 작성부터 멀티모달 작업까지 아우르는 범용 모델
O조건부 무료
OpenAI
ChatGPT 웹모바일앱API
GPT-OSS-120B
116.8B
고성능 MoE 기반 언어 추론, 맞춤형 CoT 추론, 함수 호출 등 agentic 워크플로우 지원
O무료
OpenAI
GPT-OSS-20B
20.9B
경량 MoE 언어 추론, 로컬 실행 최적화(16GB GPU), CoT 및 함수 호출 지원
O무료
OpenAI
Gemini
Gemini 3 Pro
-
대형 문맥 창 기반의 멀티모달 이해·도구 호출·구조화 출력·코드 실행·에이전트 자동화에 최적화된 범용 성능 모델.
OO조건부 무료
Google
Gemini 3 Flash
-
저지연 응답과 높은 비용 효율을 기반으로 멀티모달 이해·추론·장문 문맥 처리·대규모 API 호출에 최적화된 고속 범용 모델.
OO조건부 무료
Google
Gemini Deep Research
-
자동 분석과 리포트 생성을 위한 리서치 특화 모델
O무료
Google
Gemma
translategemma-27b-it
27B
최대 번역 품질·충실도 제공, 클라우드·고성능 하드웨어 최적화, 고자원 언어 커버리지 강화
무료
Google
translategemma-12b-it
12B
주력 고품질 모델, 27B 베이스라인 능가 성능, 로컬·랩톱 환경에서 실무적 활용
무료
Google
gemma-2-27B
27B
27B 파라미터, 텍스트 디코더, 질문 응답/요약/추론 지원
무료
Google
gemma-2-9B
9B
9B 파라미터, 텍스트 디코더, 질문 응답/요약/추론 지원
무료
Google
Grok
Grok-4.1-thinking
-
대형 문맥 창을 기반으로 심층 추론, 멀티모달 이해, 도구 호출, 구조화 출력, 코드 실행, 에이전트 자동화에 특화된 고난도 추론 중심 모델.
OOO무료
xAI
모바일앱
Grok-4.1
-
대형 문맥 창 기반의 멀티모달 이해, 신뢰성 향상된 구조화 출력, 도구 호출, 코드 실행, 에이전트 작업 흐름에 적합하도록 균형 있게 구성된 범용 성능 모델.
OOO무료
xAI
웹 플랫폼모바일앱
Grok-4.1-Fast
-
대형 문맥 창(최대 2 백만 토큰)을 기반으로 멀티모달 이해, 도구 호출, 구조화 출력, 코드 실행, 에이전트 자동화 작업에 최적화된 고속·프로덕션 중심 범용 성능 모델.
OOO무료
xAI
Grok Code Fast 1
-
에이전트형 코딩 지원, 초고속 응답, 합리적 비용 구조, 추론 및 구조화 출력, 실무 최적화
유료
xAI
Grok-4
-
멀티모달, 고급 추론, 코딩 지원, 실시간 검색, 음성/대화, 대용량 컨텍스트
OOO무료
xAI
Grok-4-Fast
-
통합 추론·비추론 모드 지원, 2M 토큰 컨텍스트, 비용 효율·빠른 응답 속도, 벤치마크 상위권 성능
OOO무료
xAI
Grok-3
-
추론, 수학, 코딩에 특화된 함수 기반 모델
O유료
xAI
Grok-2
11.5B / 27B
대화, 코딩, 추론 성능 향상, MoE 기반 효율적 아키텍처, 다국어 지원
무료
xAI
Claude
Claude Opus 4.5
-
초대형 컨텍스트 기반의 심층 이해·정밀 추론·고급 코딩 지원·다중 파일 분석·문서·스프레드시트 처리·브라우저 작업 자동화에 최적화된 플래그십 수준의 종합 지능 모델.
O유료
Anthropic
Claude Sonnet 4.5 Thinking
-
장시간 추론, 에이전트 작업, 고급 코딩, 도구 활용, 대규모 컨텍스트 처리 능력이 결합된 확장형 고성능 추론 모델
O조건부 무료
Anthropic
Claude Sonnet 4.5
-
프런티어급 성능의 모델로, 복잡한 추론과 대규모 코드 분석에 강점을 지님.
OO조건부 무료
Anthropic
Claude Haiku 4.5
-
가볍고 빠른 경량형 모델로, 비용 효율성과 응답 속도가 크게 개선된 버전이며 멀티모달 입력을 지원함.
OO조건부 무료
Anthropic
Claude Opus 4.1
-
가장 강력한 엔트로픽 모델로, 리서치·에이전트 작업 등 고급 분석에 최적화됨.
OO조건부 무료
Anthropic
Claude Opus 4
-
고급 추론 기능, 코딩, 에이전트 검색, 창의적 글쓰기에 최적화
OO유료
Anthropic
Claude Sonnet 4
-
추론과 효율성의 균형에 최적화
O조건부 무료
Anthropic
Claude Sonnet 3.7
-
코딩과 웹 개발에 특화된 성능 향상
O유료
Anthropic
Claude Haiku 3.5
-
일상 작업에 최적화된 초고속 응답 모델
O유료
Anthropic
Claude Opus 3
-
복잡한 문제 해결과 창작에 강한 모델
OO유료
Anthropic
Llama
Llama 4 Scout
17B / 109B
고성능 멀티모달, 대용량 컨텍스트, 효율적 장문 분석
O무료
Meta
Llama 4 Maverick
17B / 400B
고성능 멀티모달, 빠른 응답, 저비용 운용
O무료
Meta
Llama 3.3 : 70B
70B
다국어 지원, 70B 파라미터, 효율적 성능
무료
Meta
Llama 3.2 : 11B & 90B
11B & 90B
멀티모달 지원, 이미지 인식, 고해상도 이미지/텍스트 처리
O무료
Meta
Llama 3.1 : 8B & 405B
8B & 405B
다국어 지원, 다양한 파라미터, 강화된 가드, 고속 추론
무료
Meta
Llama-3-8B
8B
프리트레인 모델, 범용 언어 처리, 128K 컨텍스트
무료
Meta
Copilot
Microsoft 365 Copilot
-
MS 365 앱 통합, 조직 데이터 연동, 업무 자동화
O유료
Microsoft
GitHub Copilot
-
코드 자동완성, IDE 통합, Copilot Chat 지원
O조건부 무료
Microsoft
Copilot Chat
-
모델 선택 가능, 복잡한 추론, 멀티모달 입력
O무료
Microsoft
Copilot Studio
-
맞춤형 에이전트, 업무 자동화, 비즈니스 통합
O무료
Microsoft
Dynamics 365 Copilot
-
CRM/ERP 자동화, 실시간 인사이트
유료
Microsoft
Phi
Phi-4-reasoning
14B
논리적 사고와 문제 해결 능력
O무료
Microsoft
Phi-4-reasoning-plus
14B
복잡한 문제 해결, 요약 특화
O무료
Microsoft
Phi-4
14B
고품질 추론, 14B 컨텍스트 16K, 안전성 강화
O무료
Microsoft
Phi-3.5-MoE-instruct
42B
MoE 아키텍처, 효율적 지시 학습
무료
Microsoft
Mistral
Devstral-2-123B-Instruct-2512
123B
FP8 정밀도 기반 플래그십 코드 특화 모델. 256K 토큰 장문맥 지원. 에이전트형 코딩·도구 호출·다중 파일 편집 기능 통합. 대규모 코드베이스 이해·리팩터링·테스트 생성 등 복잡한 개발 워크플로 자동화에 적합.
OO무료
Mistral AI
Devstral-Small-2-24B-Instruct-2512
24B
256K 토큰 장문맥 지원. 코드 리팩터링·테스트 생성·에이전트형 코딩 작업에 적합한 고효율 모델
OO무료
Mistral AI
Mistral-Large-3
41B / 675B
Sparse MoE 구조 기반 플래그십 모델. 256k 토큰 장문맥 지원. 멀티모달(텍스트 + 이미지), 다국어 대응. 기업용 에이전트·대규모 워크플로우·복잡한 추론 및 문서 분석에 적합.
OO무료
Mistral AI
Ministral-3-14B
14B
Dense 모델 중 최고 성능 모델. 단일 고성능 GPU에서도 운용 가능. 텍스트 + 이미지 입력 지원. 비용 대비 성능 균형이 좋아 온프렘 또는 엣지 환경에서 실용적. 일반 대화, 문서 생성, 번역, 기본 코딩/스크립트 작업에 적합.
OO무료
Mistral AI
Ministral-3-8B
8B
경량·저비용 모델로 응답 속도와 자원 효율 우수. 채팅 시스템, 내부 도구, 자동화 흐름(RAG, 간단한 문서 처리)에 적합. 단일 GPU 또는 엣지 디바이스에서도 구동 가능.
O무료
Mistral AI
Magistral Medium
-
고정밀 추론, 실시간 응답, 다국어 지원, 체계적 reasoning
O유료
Mistral AI
Magistral Small
24B
24B reasoning, 로컬 실행, 다국어 지원, 추론 trace
O무료
Mistral AI
Mistral-Small-3.1
24B
가벼운 지시 특화 모델, 함수 호출 및 멀티모달(이미지 등) 입력 지원
O무료
Mistral AI
Mistral-Small-3
24B
빠른 지시 특화 모델, 함수 호출 지원
무료
Mistral AI
Mistral-Small-24B-Instruct
24B
코드·수학·일반 명령에 특화된 지시 학습 모델
무료
Mistral AI
Mistral Large 2
123B
고급 추론·코딩·수학, 128K 컨텍스트
무료
Mistral AI
Mistral Large
-
다국어·텍스트·코드 생성에 강점
유료
Mistral AI
Pixtral Large
124B
멀티모달, 문서·차트·이미지 이해
O무료
Mistral AI
Nova
Nova Pro 1.0
-
고성능 멀티모달, 범용 정확도·속도·비용 효율
O조건부 무료
Amazon
Nova Lite 1.0
-
초저비용 멀티모달, 300K 토큰 컨텍스트
O조건부 무료
Amazon
Nova Micro 1.0
-
초저비용·초고속 텍스트 모델
조건부 무료
Amazon
Qwen
Qwen3-Next-80B-A3B-Thinking
3B / 80B
Chain-of-Thought 최적화, 복잡한 문제 해결·수학·코드 추론에 강점
O무료
Alibaba Cloud
Qwen3-Next-80B-A3B-Instruct
3B / 80B
Instruction-tuned, 빠른 응답과 초장문 문맥 처리에 최적화
O무료
Alibaba Cloud
Qwen3-235B-A22B-Thinking
22B / 235B
Thinking 전용, 235B MoE, 256K 컨텍스트, 논리·수학·코딩 등에서 최상급 추론 성능
O무료
Alibaba Cloud
Qwen3-Coder-480B-A35B-Instruct
35B / 480B
에이전트 코딩 특화, 명령어 기반 최적화, 멀티 언어·도구 환경 대응, 복합 코딩 작업 수행
무료
Alibaba Cloud
Qwen3-235B-A22B
235B
235B MoE, 128K 컨텍스트, 하이브리드 추론
OO무료
Alibaba Cloud
Qwen3-30B-A3B
30B
MoE 구조, 128K 컨텍스트, 하이브리드 추론
OO무료
Alibaba Cloud
Qwen3-32B
32B
32B, 하이브리드 추론, 에이전트 지원
OO무료
Alibaba Cloud
Qwen2.5-Max
325B
325B MoE, 고성능 추론·코딩
OO무료
Alibaba Cloud
Qwen2.5-Plus
-
고성능 추론·코딩
OO무료
Alibaba Cloud
QwQ-32B
32B
32B, 추론·코딩 우수, 128K 컨텍스트
OO무료
Alibaba Cloud
Qwen2.5-Turbo
-
1M 토큰 컨텍스트, 고속·정밀 추론
OO무료
Alibaba Cloud
QVQ-Max
-
시각 수학·의료 영상 멀티모달
OO무료
Alibaba Cloud
Qwen2.5-VL-32B-Instruct
32B
32B, 비디오 이해 특화
OO무료
Alibaba Cloud
Qwen2.5-Coder-32B-Instruct
32B
코드 생성·디버깅 특화, 초장문 지원
OO무료
Alibaba Cloud
Qwen2.5-Coder-14B-Instruct
14.7B
코드 생성·디버깅 특화, 초장문 지원
O무료
Alibaba Cloud
Qwen2.5-72B-Instruct
72B
72B, 장문 생성 및 다국어 지원
OO무료
Alibaba Cloud
Kimi
Kimi-K2-thinking
32B / 1T
연속적 도구 활용 기반의 고도 추론·장기 에이전시 수행·다단계 문제 분석·목표지향적 작업 계획·대규모 지식 처리에 최적화된 에이전트형 모델.
O무료
Mooshotai
Kimi-K2-instruct
32B / 1T
128K 컨텍스트, 1조 파라미터 MoE, JSON 기반 툴 자동 호출, LiveCodeBench 상위권 코드 성능
O무료
Mooshotai
GLM
GLM‑4.7
358B
복합 추론 강화, 200K 컨텍스트 지원, 코드 생성 성능 개선, 도구 활용·에이전트 작업 향상
OO무료
Z.AI
GLM‑4.6
32B / 355B
Claude Sonnet 4에 근접한 성능, 저비용 구조, 긴 문맥 처리(200K), 향상된 코딩 및 추론 능력, 에이전트 활용 최적화
OO무료
Z.AI
GLM‑4.5V
12B / 106B
이미지·영상·문서·GUI까지 아우르는 멀티모달 추론 능력, Thinking Mode 지원, 효율적인 하이브리드 학습 방식 적용
O무료
Z.AI
GLM-4.5
32B / 355B
추론, 코딩, 에이전트 기능을 통합한 초대형 오픈소스 LLM
O무료
Z.AI
GLM-4.5-Air
12B / 106B
경량화된 고성능 LLM으로, 효율적인 추론과 코드 생성 지원
O무료
Z.AI
GLM-4.1V-9B-Thinking
9B
이미지와 텍스트를 함께 이해하는 멀티모달 추론 특화 모델
O무료
Z.AI
MiniMax
MiniMax-M2
10B / 230B
코드 생성 및 디버깅, 복합 워크플로우 자동화, 도구 호출 지원, 고속 추론
O무료
MiniMax AI
Aya
aya-vision-32b
32B
32B 멀티모달, 이미지 캡션·질의응답·요약 지원, 23개 언어 처리
O무료
Cohere
aya-23-35B
-
35B 다국어 모델, 요약·번역·지시 수행에 최적화, 23개 언어 지원
무료
Cohere
aya-23-8B
8B
23개 언어에 최적화된 지시 학습, 고품질 다국어 생성
무료
Cohere
DeepSeek
DeepSeek V3.1
37B / 671B
MoE 구조, Thinking·Non-Thinking 하이브리드 추론 모드 지원, 128K 컨텍스트, 도구 호출 성능 최적화, FP8 정밀도 활용
O무료
DeepSeek
DeepSeek-R1
37B / 671B
고급 추론 및 코딩 능력, 복잡한 문제 해결
O무료
DeepSeek
DeepSeek V3
37B / 671B
MoE 아키텍처, 고효율·고성능, 텍스트 생성·코딩·번역 등 높은 지능 및 추론
무료
DeepSeek
DeepSeek V2.5
-
MoE 아키텍처, 다양한 언어 및 코딩 지원
무료
DeepSeek
Hunyuan
Hunyuan-A13B-Instruct
13B / 80B
MoE 아키텍처, 13B 활성 파라미터 기반의 고효율·고성능 LLM, 하이브리드 추론 모드 제공
O조건부 무료
Tencent
LongCat
LongCat-Flash-Thinking
27B / 562B
추론 중심 특화, 도구 활용 + 정형 증명 강화, 도메인 병렬 RL 기반 학습
O무료
Meituan
LongCat-Flash-chat
27B / 562B
일반 질의응답 및 에이전트 과제 지원, 추론 중심 기능 포함
무료
Meituan
XBai
XBai-o4
32.8B
복잡한 추론·코딩 강점, PRM·정책 모델 통합으로 추론 비용 99% 절감
무료
MetaStone AI
CLOVA X
HyperCLOVA-X-SEED-14B-Think
14B
경량화 구조, 고성능 추론, 한국어 특화, AI 에이전트 최적화
무료
Naver
HyperCLOVA X
-
한국어 최적화, 다국어 및 코딩 지원
O조건부 무료
Naver
EXAONE
EXAONE-4.0-32B
32B
고성능 추론과 전문가 수준 벤치마크 성능을 갖춘 한국어 특화 모델
O비상업 무료
LG
EXAONE-Deep-32B
32B
수학·코딩 특화, 32K 컨텍스트
무료
LG
EXAONE-Deep-7.8B
7.8B
수학·코딩 중심 고성능 추론, 긴 문맥 지원
무료
LG
Mi:dm
Mi:dm-2.0-base
11.5B
고성능 한국어 중심 모델, 범용 목적, 지식검색·문서기반 Q&A 등 다양한 서비스 적합
무료
KT
Solar
Solar-Open-100B
12B / 103B
국내 독자 개발 모델, Mixture-of-Experts(MoE) 아키텍처 기반, 12B 활성 파라미터 효율 구조, 약 19.7조 토큰 사전학습, 높은 한국어 및 다국어 벤치마크 성능
무료
Upstage
Syn Pro
30B
일본어 및 일본 현지 비즈니스 문맥에 특화된 대형 언어 모델, 내장된 데이터 주권 보장, 고정밀·고효율 추론 지원
무료
Upstage
Solar-pro-2
30.9B
고난도 추론과 한국어 문서 처리에 최적화된 경량형 LLM
O무료
Upstage
Kanana
kanana-2-30b-a3b-thinking
30B
복잡한 논리적 사고와 단계적 문제 해결을 위한 추론 특화 모델
무료
카카오
kanana-2-30b-a3b-instruct
30B
사용자 지시 이해와 정확한 응답 생성을 강화한 지시 이행 중심 모델
무료
카카오
kanana-2-30b-a3b-base
30B
사전 학습 가중치를 제공하는 기본 모델로 파인튜닝과 연구 목적에 적합
무료
카카오
Kanana Flag 32.5B
32.5B
한국어·영어 최적화, 고효율 계산
카카오
VARCO
VARCO-Vision-2.0-14B
14B
멀티이미지 입력 지원, 한국어 특화, OCR 텍스트 위치 인식, 그라운딩·리퍼링 기능 탑재
O비상업 무료
NCSOFT
Trillion
Tri-20B
20B
단계적 사고(CoT) 학습과 교차언어 데이터 증강(XLDA) 기반의 고정밀 추론·다국어(한국어 중심) 성능 강화
무료
Trillion Labs
Motif 2
Motif-2-12.7B-Instruct
12.7B
Grouped Differential Attention(GDA)와 Muon Optimizer 적용, 강화학습 없이 SFT만으로도 높은 추론 성능 구현, Flash Attention2 기반의 고속 연산 지원
무료
Motif-Technologies
Motif-2-12.7B-Base
12.7B
Grouped Differential Attention(GDA) 구조와 Muon Optimizer를 적용해 연산 효율성과 병렬 학습 성능을 높임, 기본 베이스 모델, 다양한 다운스트림 태스크에 활용 가능한 고성능 기초 모델
무료
Motif-Technologies
Rnj
Rnj-1
8B
세계적 수준의 코드 생성 및 추론 성능(코딩·수학·STEM), 장문 컨텍스트 처리(최대 32K), 오픈소스 기반 연구 확장성, 에이전트식 코드 문제 해결 능력
무료
Essential AI
Olmo
Olmo-3.1-32B-Think
32B
복잡한 논리 추론, 수학적 문제 해결, 장문 맥락 이해 등 고차원적 사고 과제에 최적화된 모델. 연구 및 분석 중심 용도로 설계되어 추론 능력과 응답 일관성이 뛰어남.
O무료
Allen AI
Olmo-3.1-32B-Instruct
32B
사용자 지시와 대화 흐름을 자연스럽게 이해하고 따르도록 튜닝된 모델. 코드 작성, 질문 응답, 문서 생성 등 다양한 실무형 작업에 적합.
무료
Allen AI

📌 용어 설명

조건부 무료
하루 사용량이 제한된 무료 서비스로, 사용자가 많이 이용하기 어려운 제약이 있습니다.
비전 기능
이미지를 업로드하거나 시각 정보를 제공했을 때, 이를 인식하고 해석해주는 기능입니다.
고급 추론 기능
AI가 여러 단계의 사고 과정을 통해 복잡한 문제를 해결하는 기능입니다. (예: 수학 풀이, 다단계 의사결정, 논리게임 해결 등)
심화 리서치 기능
AI가 리서치 주제를 받아 인터넷 자료를 탐색하고 분석해, 그 결과를 종합적인 보고서나 요약 문서 형태로 자동 작성해주는 기능입니다.

← 좌우로 스크롤하여 더 많은 정보를 확인하세요 →