뉴스

업스테이지의 AI 모델, 'Solar Pro 2' 공개! 주요 특징과 그 성능은?

2025-07-14
국내AI
#국내AI#한국형 AI 모델#한국어 특화 AI#한국어 언어모델#추론모델#업스테이지 AI#Solar Pro 2.0#국내 AI 비교

한국형 소버린 AI로 인해 등장하고 있는 국산형 AI 모델

글로벌 빅테크 기업들이 주도하는 AI 기술 전쟁 속에서, 'AI 주권(Sovereign AI)' 확보는 국가적 화두로 떠올랐습니다. 우리의 데이터와 기술로 만든 AI를 통해 기술 종속에서 벗어나고, 한국의 문화와 특성에 맞는 AI를 발전시키려는 움직임이 활발해지고 있습니다.

글로벌 AI 시장이 대형 해외 모델 위주로 재편된 가운데, 한국 기업들도 한국어와 기업·산업 특화 기능에 초점을 맞춘 독자적 LLM 개발을 강화하고 있습니다. 이러한 전략은 데이터 주권, 보안, 비용 효율성 측면에서 유리하며, 특히 금융·의료·법률 등 전문 영역에서 경쟁력을 갖추기 위해 필수적입니다.

글로벌 AI 시장이 대형 해외 모델 중심으로 재편되는 가운데, 국내 기업들도 한국어 및 산업 특화 기능을 중심으로 한 국산 LLM 개발에 박차를 가하고 있습니다. 이러한 흐름은 데이터 주권 확보와 보안, 비용 효율성 측면에서 중요하며, 특히 전문 영역에서 실질적인 경쟁력을 갖추기 위한 전략으로 주목받고 있습니다.

그 중심에 있는 모델이 바로 Upstage의 최신 모델 Solar Pro 2.0입니다.

이러한 흐름 속에서 국내 AI 기업들은 글로벌 모델과 대등하게 경쟁할 수 있는 고성능 국산 AI 모델을 잇달아 선보이고 있습니다. 그 중 AI 스타트업 업스테이지(Upstage)가 공개한 '솔라 프로 2.0(Solar Pro 2.0)'입니다.


1. '솔라 프로 2.0 (Solar Pro 2)'는 무엇인가?

솔라 프로 2.0는 국내 AI 스타트업 업스테이지(Upstage)가 개발한 차세대 대규모 언어모델(LLM)로, 2025년 5월 20일 공식 출시된 최신 모델입니다. 이 모델은 단순한 텍스트 생성 능력을 넘어 논리적 사고와 복잡한 문제 해결이 가능한 추론형 LLM으로 설계되었습니다.

Solar Pro 2.0는 Upstage가 개발한 310억 파라미터(31B) 규모의 대형 언어모델로, 2025년 5월 20일 프리뷰 버전으로 첫 공개되었습니다.
이 모델은 이전 버전인 Solar Pro(22B)보다 더 확장된 파라미터 구조를 바탕으로, 더 정교한 추론 능력과 텍스트 처리 효율을 제공합니다.

현재 Upstage 콘솔에서 2025년 7월 15일까지 무료 체험이 가능하며, 경량 모델임에도 불구하고 70B급 글로벌 모델과 경쟁 가능한 성능을 보입니다.


2. 솔라 프로 2.0 주요 특징

  1. 경량화 대비 프론티어급 성능
    • 31B(310억 개) 파라미터임에도 Llama 3.3 70B, Qwen2‑72B 등 70B급 대형 모델과 견줄 만한 언어 이해 능력과 응답 품질을 보입니다.
    • 정교한 사전학습과 최적화 설계를 통해 운영 비용 절감, 응답 속도 향상, 정확도 개선이 이루어졌습니다.
  2. 하이브리드 모드: Chat & Reasoning 지원
    • 일반 대화에 적합한 Chat Mode와 복잡한 문제 해결을 위한 Reasoning Mode를 모두 지원합니다.
    • Reasoning Mode는 reasoning_effort 플래그를 통해 활성화되며, 수학 계산, 코드 생성, 논리적 추론 등 멀티스텝 질의에 효과적입니다.
    • Qwen3‑32B와 유사한 수준의 추론 성능을 제공합니다.
  3. 최대 64K 토큰 입력 처리
    • 한 번에 64,000개 토큰까지 처리 가능하여, 긴 문서나 대규모 대화 흐름도 끊김 없이 이해하고 응답할 수 있습니다.
    • 이는 기존 모델 대비 약 2배 수준의 입력 처리 용량으로, 문서 분석, 회의록 요약 등 실무 활용도에 강점을 가집니다.
  4. 한국어 최적화 및 다국어 대응
    • 한국어 성능이 특히 우수하며, Ko-MMLU, Hae-Rae 등 주요 벤치마크에서 상위권 성적을 기록했습니다.
    • 영어, 일본어 등 다국어 지원도 안정적으로 제공되며, GPT-4, Claude 3와 비교해도 경쟁력 있는 결과를 보여줍니다.
  5. 실무 및 산업 특화 대응력
    • 법률, 금융, 의료 등 고난도 전문 도메인에서도 높은 정확성과 일관성을 제공합니다.
    • 문서 요약, 자동화된 보고서 작성, 툴 연동, 파일 생성 등 에이전트형 LLM으로의 활용이 가능합니다.
  6. 엔터프라이즈 환경 강화 예정
    • 정식 출시 버전에서는 보안성, 안정성, 온프레미스 및 클라우드 마켓플레이스 배포 등 엔터프라이즈 요구사항에 맞춘 기능이 추가될 예정입니다.

3. 솔라 프로 2.0 Preview 벤치마크 성능

솔라 프로 2.0 Preview는 업스테이지에서 개발한 310억(30B) 파라미터 규모의 언어모델로, 다양한 벤치마크에서 대형 모델과 견줄 만한 성능을 기록합니다.

  1. 한국어 문제 가장 잘 해결 (Ko-MMLU)
    • 한국어 지식 문제(Ko-MMLU)에서 78.72점 / 84.08점 (일반 모드 / 추론 모드)을 기록하며 모든 모델 중 최고 성능을 보여줍니다.
    • 비교) Qwen3-32B: 75.24점 / Llama 3-70B: 74.76점
  2. 한국어 독해력 성능 최고 (Hae-Rae)
    • Hae-Rae 1.0는 업스테이지에서 자체 개발한, 한국어 긴 문장의 독해력과 이해 능력을 평가하는 벤치마크입니다. Solar Pro 2.0 모델은 이 평가에서 83.88점 / 85.21점 (일반 모드 / 추론 모드)을 기록했습니다.
    • 비교) Qwen2.5-72B: 77.18점 / Mistral-24B: 67.17점
  3. 영어 문제 풀이 능력도 대형 모델과 유사 (MMLU-0shot-CoT)
    • 영어 일반 지식 문제 (MMLU-0shot-CoT) 에서 83.52점 / 86.92점 (일반 모드 / 추론 모드)을 기록했습니다.
    • Meta의 Llama 3-70B 모델(86.88점)과 거의 동일한 수준입니다.
  4. 실제 대화 품질도 매우 우수 (MT-Bench)
    • 실제 대화 흐름과 자연스러움을 평가하는 MT-Bench 항목에서 86.19점 / 87.06점 (일반 모드 / 추론 모드)을 기록했습니다.
    • 비교) Qwen3: 86.94점 / Mistral: 85.19점
솔라 프로 2 벤치마크1 솔라 프로 2 벤치마크2

출처: 업스테이지 공식 페이지 (이미지 클릭시 확대)


4. 국내 AI와 비교

평가 항목Solar Pro 2.0
Preview
Solar Pro 2.0
Preview (Reasoning)
EXAONE-3.5-32B
instruct
Mi:dm-2.0
Base-inst
Mi:dm-2.0
Base-inst
En-MMLU-0shot-CoT83.52%86.92%70.24%73.7%66.95%
En-IFEval84.15%85.18%75.99%84.0%79.86%
En-MT-Bench86.19%87.06%73.81%-74.38%
Ko-MMLU-0shot-CoT78.72%84.08%61.16%57.3%61.70%
Ko-IFEval82.56%84.65%64.34%82.0%70.04%
Ko-MT-Bench85.95%84.12%74.29%89.7%78.56%
Ja-MMLU-0shot-CoT78.08%79.22%59.00%--
Ja-IFEval77.66%79.95%60.57%--

En-MMLU-0shot-CoT : 객관식 문제 기반, 지식 정답 맞추기 중심
En-IFEval : 사용자 지시 이행의 정확성을 보는 평가
En-MT-Bench : 이해도, 표현력, 유용성, 논리성 등을 종합적으로 판단
Ko-MMLU-0shot-CoT : 한국어 MMLU 평가
Ko-IFEval : 한국어 IFEval 평가
Ko-MT-Bench : 한국어 MT-Bench 평가
Ja-MMLU-0shot-CoT : 일본어 MMLU 평가
Ja-IFEval : 일본어 IFEval 평가


5. 주요 시사점 및

솔라 프로 2.0 Preview는 310억 파라미터 규모의 국산 모델임에도 불구하고, 한국어·영어·일본어 전반에서 대형 글로벌 모델과 대등한 성능을 기록하며, 국산 LLM의 기술 성숙도가 빠르게 상향 평준화되고 있음을 보여줍니다.

특히 한국어 MMLU, Hae-Rae(독해력), Ko-IFEval(지시 이행 평가)에서 전 모델 중 최고 수준의 성능을 기록했다는 점은, 단순한 모델 성능을 넘어 실제 서비스 환경에서의 실용성과 연결되는 중요한 성과입니다. 이는 GPT 계열 등 해외 모델을 번역 기반으로 활용하던 기존 흐름에서 벗어나, 한국어 사용자와 업무 환경에 최적화된 AI 모델이 직접 등장했다는 데 의의가 있습니다.

또한 일반 대화에 적합한 일반 모드(Chat Mode) 와, 복잡한 문제 해결에 특화된 추론 모드(Reasoning Mode) 를 상황에 따라 선택적으로 활용할 수 있는 구조는, 모델의 운영 효율성과 적용 범위를 모두 확보한 전략적 설계로 평가됩니다.

이를 통해 기업이나 기관은 목적에 맞게 AI를 유연하게 활용할 수 있으며, 실제 도입 시 비용 대비 효과를 극대화할 수 있는 기반을 마련할 수 있습니다.

결론적으로 솔라 프로 2.0 Preview는 기술적 완성도를 넘어 실제 시장에서 작동 가능한 국산 소버린 AI의 가능성을 보여주는 대표 사례로 볼 수 있습니다. 이는 한국형 AI 생태계가 단순한 기술 개발을 넘어, 산업 실용성과 경쟁력 확보라는 다음 단계로 진입하고 있음을 시사합니다.


마무리

솔라 프로 2.0 Preview는 국산 언어모델이 기술력과 실용성 모두에서 글로벌 대형 모델과 경쟁할 수 있음을 보여준 의미 있는 사례입니다. 앞으로도 국내 AI 개발이 더욱 활발해지고, 다양한 분야에서 강력한 성능을 발휘할 수 있는 한국형 모델들이 지속적으로 등장하길 기대합니다.

작성자 : AIMIZING.