GPT-OSS란? OpenAI 오픈소스 AI 모델 출시와 활용 가이드
OpenAI 최초의 오픈 웨이트 모델
안녕하세요!
오늘은 AI 기술에 관심 있는 모든 분들이 주목할 만한 소식을 가지고 왔습니다. 바로 OpenAI가 2025년 8월 5일, 최초로 공개한 오픈 웨이트(open-weight) 대형 언어 모델, GPT-OSS에 대한 포스팅입니다. 이번 공개는 AI 기술의 민주화와 투명성을 향한 중요한 발걸음이라고 할 수 있습니다. 그럼 지금부터 GPT-OSS에 대해 자세히 알아보겠습니다.
GPT-OSS 모델이란?
GPT-OSS는 OpenAI가 AI 기술의 접근성 확대를 목표로 공개한 최초의 오픈 웨이트(open-weight) 대형 언어 모델입니다. 약 6년 만의 공개 출시라는 점에서 큰 의미를 가집니다. 이 모델은 강력한 성능을 요구하는 전문가 환경을 위한 고성능 버전(gpt-oss-120b) 과, 개인용 컴퓨터나 소형 디바이스에서도 활용 가능한 경량화 버전(gpt-oss-20b) 으로 나뉘어 제공됩니다. 이를 통해 사용자는 자신의 목적과 하드웨어 환경에 맞춰 최적의 모델을 선택하여 활용할 수 있습니다.
두 모델의 자세한 사양은 아래 표를 통해 확인하실 수 있습니다.
[모델 정보 요약]
항목 | gpt-oss-120b 모델 | gpt-oss-20b 모델 |
---|---|---|
파라미터 수 | 116.8B | 20.9B |
개발사 | OpenAI | OpenAI |
출시일 | 2025년 8월 5일 | 2025년 8월 5일 |
Expert 수 | 레이어당 총 128개 | 레이어당 총 32개 |
활성 Expert 수 | 토큰당 4개 | 토큰당 4개 |
컨텍스트 길이 | 128,000 토큰 | 128,000 토큰 |
특징 | MoE 구조로 고효율 추론, 체인 오브 사고, 툴 호출, 조절 가능한 추론 강도 지원 | 16GB GPU 기반 엣지 환경 실행에 적합, 체인 오브 사고, 툴 호출, 추론 강도 설정 가능 |
라이선스 | Apache 2.0 (상업적 사용 가능) | Apache 2.0 (상업적 사용 가능) |
주요 특징은 무엇일까요?
GPT-OSS는 다음과 같은 혁신적인 특징들을 가지고 있습니다.
- MoE (Mixture-of-Experts) 아키텍처 : 전문가 그룹(Experts) 중 일부만 선택적으로 활성화하여 연산을 수행하는 방식입니다. 이를 통해 전체 모델의 방대한 파라미터에도 불구하고 매우 효율적인 추론이 가능합니다.
- 역대 최장 컨텍스트 처리 : 최대 131,072 토큰이라는 방대한 길이의 컨텍스트를 처리할 수 있습니다. 이는 현재까지 공개된 모델 중 가장 긴 수준으로, 복잡하고 긴 문서의 이해 및 생성이 가능함을 의미합니다.
- 투명한 추론 과정 (Chain-of-Thought) : 사용자가 모델의 추론 깊이를 직접 조절하고, 그 생각의 연쇄 과정(CoT)을 출력으로 받아볼 수 있습니다. 이는 모델의 답변이 어떻게 도출되었는지 투명하게 보여주어 신뢰도를 높입니다.
성능 벤치마크
GPT-OSS 모델은 다양한 표준 학술 벤치마크에서 OpenAI의 다른 고성능 모델들과 비교해 매우 우수한 성능을 보여주었습니다.
gpt-oss-120b 모델은 전반적인 언어 이해 능력(MMLU)과 박사 수준의 질의응답(GPQA Diamond)에서 OpenAI o4-mini와 비슷한 수준을 기록했습니다. 특히 수학적 추론 능력(AIME)에서는 o4-mini를 포함한 모든 비교 모델을 뛰어넘는 최고 점수를 달성하여, 복잡한 수학 문제 해결에 탁월한 역량을 입증했습니다.
gpt-oss-20b 모델 역시 경량화 모델임에도 불구하고 인상적인 성능을 보였습니다. 특히 AIME 벤치마크에서는 모든 비교 모델 중 가장 높은 점수를 기록하며, 제한된 자원에서도 최상급 수학적 추론이 가능함을 보여주었습니다.
아래 표는 주요 벤치마크 결과를 정리한 것입니다. 각 지표의 의미는 다음과 같습니다.
- MMLU: 전반적인 언어 이해 능력 평가
- GPQA Diamond: 박사 수준의 전문 질의응답 능력 평가
- Humanity's Last Exam: 종합 난이도의 문제 해결 능력 평가
- AIME: 수학 올림피아드 수준의 문제 해결 능력 평가
항목 | gpt-oss-120b | gpt-oss-20b | OpenAI o3 | OpenAI o4-mini |
---|---|---|---|---|
MMLU | 90.0 | 85.3 | 93.4 | 93.0 |
GPQA Diamond | 80.9 | 74.2 | 77.0 | 81.4 |
Humanity's Last Exam | 19.0 | 17.3 | 24.9 | 17.7 |
AIME 2024 | 96.6 | 96.0 | 91.6 | 93.4 |
AIME 2025 | 97.9 | 98.7 | 88.9 | 92.7 |
라이선스
GPT-OSS 모델은 아파치 라이선스 2.0(Apache License 2.0) 정책을 따릅니다. 이 라이선스의 가장 큰 특징은 개인적인 용도는 물론 상업적 이용이 매우 자유롭다는 점입니다.
즉, 누구나 GPT-OSS 모델을 활용하여 다음과 같은 활동을 할 수 있습니다.
- 모델을 기반으로 새로운 상업용 서비스나 제품을 만들어 판매할 수 있습니다.
- 자유롭게 모델을 수정하고, 개선된 버전이나 파생된 모델을 만들어 배포할 수 있습니다.
- 별도의 라이선스 비용 없이 소프트웨어에 통합하여 사용할 수 있습니다.
이처럼 아파치 2.0 라이선스는 최소한의 조건(출처 및 라이선스 고지 등)만 준수한다면 거의 모든 제약 없이 모델을 활용할 수 있도록 허용합니다. 덕분에 스타트업, 기업, 개인 개발자 모두가 법적 부담 없이 GPT-OSS를 기반으로 혁신적인 아이디어를 실현할 수 있는 길이 열렸습니다.
GPT‑OSS 모델 사용방법
GPT-OSS 모델은 OpenAI에서 공개한 오픈소스 대규모 언어 모델로, 로컬 환경이나 서버 환경에서 자유롭게 실행하고 커스터마이징할 수 있는 장점이 있습니다. 사용자는 다양한 플랫폼과 실행 방식을 선택하여 자신의 환경에 맞게 적용할 수 있으며, API 서버 구축, 로컬 애플리케이션 개발, 연구·실험 목적으로 폭넓게 활용할 수 있습니다.
[GPT‑OSS 체험하기]
- gpt-oss playground : https://gpt-oss.com/
[호환 가능한 주요 플랫폼]
- vLLM : 서버 기반 OpenAI‑호환 API 제공, 고성능 서버 환경 또는 로컬 환경
- Ollama : 소비자용 실행에 최적화, 로컬 환경
→ 자세한 실행 방법 보기 : AIMIZING 블로그 – Ollama로 GPT-OSS 사용하기 - Hugging Face Transformers : Python 환경에서 직접 pipeline 방식으로 실행 가능, 로컬 환경
- LM Studio : GUI 기반 인터페이스 기반 실행, 로컬 환경
[GPT‑OSS 모델 다운로드]
- gpt-oss 허깅페이스 : https://huggingface.co/collections/openai/gpt-oss-68911959590a1634ba11c7a4
- gpt-oss 깃허브 : https://github.com/openai/gpt-oss
마무리
최근 다양한 AI 모델이 오픈소스로 공개되는 흐름 속에서, OpenAI 역시 GPT-OSS를 통해 그 대열에 합류했습니다. 이번 공개는 고성능 언어 모델을 누구나 자유롭게 활용하고, 자신만의 AI를 구축할 수 있는 기반을 마련했다는 점에서 큰 의미가 있습니다. GPT-OSS는 연구자, 개발자, 기업은 물론 개인 사용자에게도 새로운 가능성을 열어주며, 향후 AI 기술의 민주화와 혁신을 가속화하는 중요한 전환점이 될 것으로 기대됩니다.
관련 자료
- OpenAI gpt-oss 소개 페이지 - https://openai.com/ko-KR/index/introducing-gpt-oss/
- OpenAI gpt-oss 모델 페이지 - https://openai.com/ko-KR/open-models/