구글의 최신 이미지 생성 및 편집 모델, Gemini 2.5 Flash Image

최근 AI 커뮤니티에서는 ‘nano-banana’라는 코드명으로 알려진 이미지 생성 모델이 큰 화제를 모았습니다. 정체가 공개되기 전부터 성능 평가에서 최상위권을 기록하며 “어떤 기업의 작품일까?”라는 궁금증을 불러일으켰고, 다양한 추측이 이어지기도 했습니다.

그 주인공이 바로 구글의 최신 이미지 생성·편집 모델 Gemini 2.5 Flash Image입니다. 이번 글에서는 이 모델이 어떤 특징을 가지고 있으며, 왜 업계의 관심을 끌고 있는지 자세히 살펴보겠습니다.

Gemini 2.5 Flash Image 란

2025년 8월 26일, 구글은 최신 이미지 생성·편집 모델 Gemini 2.5 Flash Image(코드명 nano-banana) 를 공식 출시했습니다. 이 모델은 이전 버전인 Gemini 2.0 Flash가 가진 저지연, 비용 효율성, 사용 편의성의 장점을 계승하면서, 이미지 품질과 창의적 제어력에서 한층 더 진일보한 성능을 선보입니다.

정식 명칭은 ‘Gemini 2.5 Flash Image’이지만, 출시 전 테스트 플랫폼(LMArena 등)과 커뮤니티에서는 nano-banana라는 이름으로 불리며 일찌감치 주목을 받았습니다. 특히 이미지 생성 성능 평가에서 1위를 기록하며 공식 발표 전부터 큰 화제를 모았습니다.

주요 특징

Gemini 2.5 Flash Image는 단순한 이미지 생성을 넘어, 사용자의 창의적인 작업을 한 단계 끌어올릴 수 있는 혁신적인 기능들을 제공합니다.

1. 캐릭터 일관성 (Character Consistency)

가장 주목받는 기능 중 하나로, 여러 이미지에 걸쳐 동일한 인물이나 캐릭터의 외형적 특징을 일관되게 유지할 수 있습니다. 예를 들어, 특정 캐릭터를 다양한 배경이나 상황, 다른 각도와 포즈로 생성하더라도 그 정체성을 잃지 않아 스토리텔링이나 브랜드 자산 제작에 매우 유용합니다.

2. 자연어 기반 이미지 편집 (Conversational Editing)

"배경을 흐리게 해줘", "티셔츠의 얼룩을 지워줘" 와 같이 간단한 자연어(텍스트) 명령만으로 이미지의 특정 부분을 정밀하게 수정할 수 있습니다. 복잡한 편집 도구 없이도 객체 제거, 인물 포즈 변경, 흑백 사진의 컬러 변환 등 직관적이고 빠른 편집이 가능해 작업 효율을 크게 높여줍니다.

3. 다중 이미지 병합 (Multi-image Fusion)

여러 개의 이미지를 자연스럽게 하나의 결과물로 합성하는 기능입니다. 예를 들어, 특정 가구나 제품 이미지를 새로운 공간 이미지와 결합하여 실제처럼 배치된 모습을 연출할 수 있습니다. 이는 마케팅, 광고, 인테리어 디자인 등 다양한 분야에서 활용될 수 있습니다.

4. 시각적 추론 및 세계 지식 활용 (Visual Reasoning & World Knowledge)

단순히 이미지를 보고 묘사하는 것을 넘어, 이미지에 담긴 내용을 깊이 있게 이해하고 추론합니다. 손으로 그린 다이어그램을 인식하여 설명하거나, 이미지 속 상황에 대한 질문에 답변하는 등 고차원적인 작업 수행이 가능합니다. 이러한 능력은 복잡한 편집 지시를 한 번에 이해하고 처리하는 기반이 됩니다.

성능 평가와 순위

출시 직후 Gemini 2.5 Flash Image는 이미지 생성 성능 평가 플랫폼인 LMArena에서 단번에 최상위권에 올랐습니다. 특히 코드명 nano-banana로 테스트 단계부터 공개되며, 사용자들의 직접 투표와 비교 평가를 통해 일찌감치 두각을 나타냈습니다.

2025년 8월 26일 기준 최신 순위에서도 Gemini 2.5 Flash Image는 점수 1147점, 약 22만 표(220,674) 를 기록하며 전체 1위를 차지했습니다. 이는 2위에 오른 Google의 Imagen 4.0 Ultra 모델과 OpenAI의 GPT-Image-1을 모두 앞서는 성과로, 사용자 선호도와 실제 활용 측면에서 가장 우수한 모델임을 입증한 결과입니다.

또한 Google은 Gemini 2.5 Flash Image 외에도 Imagen 시리즈 모델들을 상위권에 다수 포진시키며 이미지 생성 분야에서 독주 체제를 강화하고 있습니다. 반면, 오픈소스 모델 중에서는 Alibaba의 Qwen-Image가 유일하게 TOP 10에 포함되며 대안적 선택지를 제공하고 있습니다.

출처: LMArena (클릭시 이미지 확대)

사용 가능한 플랫폼

성능과 혁신성을 인정받은 Gemini 2.5 Flash Image는 현재 다양한 플랫폼을 통해 활용할 수 있도록 제공되고 있습니다. 개인 사용자부터 기업 환경까지 폭넓게 대응할 수 있는 구조를 갖추고 있어 접근성이 높습니다.

Gemini API

개발자를 위한 공식 API가 제공되어 애플리케이션이나 서비스에 직접 통합할 수 있습니다. 비용은 100만 개 출력 토큰당 약 30달러이며, 이미지 한 장은 평균 1,290 출력 토큰(약 0.039달러) 에 해당합니다.
공식 문서 보기 : https://ai.google.dev/gemini-api/docs/image-generation

Google AI Studio

웹 기반 환경에서 별도의 설치 과정 없이 프롬프트만 입력하면 결과를 확인할 수 있습니다. 또한 ‘빌드 모드(Build Mode)’를 통해 제공되는 템플릿 앱으로 단일 프롬프트 실험을 진행하거나 GitHub로 손쉽게 배포할 수 있습니다.
AI Studio 바로가기 : https://aistudio.google.com/prompts/new_chat?model=gemini-2.5-flash-preview-image

Vertex AI (Google Cloud)

기업과 개발자를 위한 클라우드 환경을 지원하며, 대규모 배포와 운영을 고려한 안정적인 환경에서 모델을 실행할 수 있습니다. 프로덕션 단계에서도 신뢰할 수 있는 성능을 보장하기 때문에 비즈니스 현장에 적합합니다.
Vertex AI 바로가기 : https://console.cloud.google.com/vertex-ai/studio/multimodal?model=gemini-2.5-flash-image-preview

사용 테스트

이번에는 Google AI Studio를 통해 직접 Gemini 2.5 Flash Image 모델을 사용하여 테스트를 진행해 보았습니다.

먼저 캐릭터 이미지를 생성한 뒤, 동일한 캐릭터가 여러 상황에서 일관성을 유지하는지를 확인하기 위해 다음과 같은 순서로 프롬프트를 입력했습니다.

프롬프트 1 (이미지 생성) : 갈색 단발머리에 동그란 안경을 쓴, 파란색 후드티를 입은 20대 여성 캐릭터
프롬프트 2 (이미지 편집) : 위 캐릭터가 서울의 한 카페 창가에 앉아 노트북을 하는 모습
프롬프트 3 (이미지 편집) : 위 캐릭터가 저녁 노을을 배경으로 서 있는 뒷모습

이미지 생성 및 편집에는 약 10초가 소요되었으며, 프롬프트에 맞는 결과물이 정확히 생성되었습니다. 특히 캐릭터의 외형적 특징이 세 장의 이미지 모두에서 일관되게 유지되는 것을 확인할 수 있었습니다.

아래는 해당 프롬프트를 기반으로 생성된 이미지 결과입니다.

이 외에도 Gemini 2.5 Flash Image는 매우 다양한 이미지 생성 및 편집을 지원합니다. 단순히 캐릭터를 만들고 장면을 바꾸는 수준을 넘어, 원하는 특정 포즈를 자연스럽게 취하도록 지시할 수 있으며, 이미지 속에 텍스트나 로고를 삽입하는 것도 가능합니다. 또한 배경을 바꾸거나 분위기를 전환하는 등 세밀한 편집까지 손쉽게 수행할 수 있어, 창의적인 작업을 더욱 자유롭게 확장할 수 있습니다.

마무리

Gemini 2.5 Flash Image는 이미지 생성 모델 순위에서 1위를 기록할 만큼 압도적인 속도와 성능을 보여주며, 이미 사용자들로부터 높은 평가를 받고 있습니다. 단순히 새로운 모델의 등장을 넘어, 앞으로 Gemini 플랫폼 전반에 본격적으로 통합되어 더 다양한 서비스와 도구에서 활용될 가능성이 큽니다.

이는 개인 창작자들이 손쉽게 고품질 이미지를 제작할 수 있는 환경을 마련할 뿐 아니라, 기업 역시 비용과 시간을 절감하면서도 안정적인 결과물을 확보할 수 있게 한다는 점에서 의미가 큽니다. 결국 더 많은 창작자와 기업이 고품질·저비용·고효율의 창작 경험을 향유하게 될 것으로 기대됩니다.

감사합니다. 😊

[참고 링크]

🔗 Google API 공식 문서 : https://ai.google.dev/gemini-api/docs/image-generation
🔗 Google AI Studio : https://aistudio.google.com/prompts/new_chat?model=gemini-2.5-flash-preview-image
🔗 Vertex AI : https://console.cloud.google.com/vertex-ai/studio/multimodal?model=gemini-2.5-flash-image-preview

'나노 바나나'의 정체, 구글 Gemini 2.5 Flash Image 공개!