Google의 Nano-Banana는 새로운 이미지 생성 시대를 잠금 해제했습니다.

저자의 이미지 | Gemini (나노-바나 자화상)

틀 소개

생성 AI를 사용한 이미지 생성은 개인과 비즈니스 모두에게 널리 사용되는 도구가되어 디자인 전문 지식이 필요하지 않고도 의도 한 영상을 즉시 만들 수 있습니다. 기본적으로 이러한 도구는 상당한 시간이 걸리는 작업을 가속화하여 몇 초 안에 완료 할 수 있습니다.

기술과 경쟁의 발전으로, 많은 현대적인 고급 이미지 생성 제품이 출시되었습니다. 안정적인 확산,,, 미드 주니,,, 에서,,, 영상그리고 더 많은. 각각은 사용자에게 고유 한 이점을 제공합니다. 그러나 Google은 최근 Gemini 2.5 Flash Image (또는 Nano-Banana)의 출시로 이미지 생성 환경에 큰 영향을 미쳤습니다.

Nano-Banana는 Google의 고급 이미지 생성 및 편집 모델로, 현실적인 이미지 생성, 다중 이미지 블렌딩, 문자 일관성, 타겟 프롬프트 기반 변환 및 공개 접근성과 같은 기능을 갖춘 Google의 고급 이미지 생성 및 편집 모델입니다. 이 모델은 Google 또는 경쟁 업체의 이전 모델보다 훨씬 더 큰 제어를 제공합니다.

이 기사는 이미지를 생성하고 편집하는 Nano-Banana의 능력을 탐구합니다. 우리는이 기능을 사용하여 시연 할 것입니다 공부하는 Google 플랫폼과 쌍둥이 자리 API 파이썬 환경 내에서.

들어가자.

틀 나노-바나나 모델 테스트

이 자습서를 따르려면 Google 계정에 등록하고 Google AI Studio에 로그인해야합니다. 또한 획득해야합니다 API 키 무료 계층이 없으므로 유료 계획이 필요한 Gemini API를 사용합니다.

Python과 함께 API를 사용하려면 설치하십시오. Google 생성 AI 다음 명령이 포함 된 라이브러리 :

계정이 설정되면 Nano-Banana 모델을 사용하는 방법을 살펴 보겠습니다.

먼저 Google AI Studio로 이동하여 선택하십시오 Gemini-2.5-flash-image-preview 모델, 우리가 사용할 Nano-Banana 모델입니다.

페르시아 파나

모델을 선택하면 새 채팅을 시작하여 프롬프트에서 이미지를 생성 할 수 있습니다. Google에서 알 수 있듯이 최상의 결과를 얻는 기본 원칙은 다음과 같습니다. 목록 키워드가 아니라 장면을 설명하십시오. 당신이 계획하는 이미지를 설명하는이 이야기 접근법은 일반적으로 우수한 결과를 얻습니다.

AI Studio Chat 인터페이스에는 프롬프트를 입력 할 수있는 아래 플랫폼과 같은 플랫폼이 표시됩니다.

페르시아 파나

우리는 다음 프롬프트를 사용하여 예시에 대한 사진 이미지를 생성 할 것입니다.

인도네시아 바틱 장인의 사진 릴리즈 클로즈업 초상화는 왁스로 얼룩진 손으로 캔팅 펜으로 인디고 천에 흐르는 모티프를 추적합니다. 그녀는 산들 바람 베란다의 나무 테이블에서 일합니다. 접힌 섬유와 염료 통이 그녀의 뒤에 흐려집니다. 늦은 아침 창은 직물을 가로 질러 갈퀴가되어 미세한 왁스 선과 티크 곡물을 나타냅니다. 부드러운 분리와 크림 같은 보케를 위해 f/2에서 85mm에 캡처했습니다. 전반적인 분위기는 집중되고 촉각 적이며 자랑 스럽습니다.

생성 된 이미지는 다음과 같습니다.

페르시아 파나

보시다시피, 생성 된 이미지는 현실적이고 주어진 프롬프트에 충실하게 부착됩니다. Python 구현을 선호하는 경우 다음 코드를 사용하여 이미지를 만들 수 있습니다.

from google import genai
from google.genai import types
from PIL import Image
from io import BytesIO
from IPython.display import display 

# Replace 'YOUR-API-KEY' with your actual API key
api_key = 'YOUR-API-KEY'
client = genai.Client(api_key=api_key)

prompt = "A photorealistic close-up portrait of an Indonesian batik artisan, hands stained with wax, tracing a flowing motif on indigo cloth with a canting pen. She works at a wooden table in a breezy veranda; folded textiles and dye vats blur behind her. Late-morning window light rakes across the fabric, revealing fine wax lines and the grain of the teak. Captured on an 85 mm at f/2 for gentle separation and creamy bokeh. The overall mood is focused, tactile, and proud."

response = client.models.generate_content(
    model="gemini-2.5-flash-image-preview",
    contents=prompt,
)

image_parts = [
    part.inline_data.data
    for part in response.candidates[0].content.parts
    if part.inline_data
]

if image_parts:
    image = Image.open(BytesIO(image_parts[0]))
    # image.save('your_image.png')
    display(image)

API 키와 원하는 프롬프트를 제공하면 위의 Python 코드가 이미지를 생성합니다.

우리는 나노-바나나 모델이 사진 이미지를 생성 할 수 있지만 그 강점은 더욱 확장된다는 것을 알았습니다. 앞에서 언급했듯이 나노-바나나는 이미지 편집에 특히 강력하며 다음에 탐색 할 것입니다.

방금 생성 한 이미지로 프롬프트 기반 이미지 편집을 시도해 봅시다. 우리는 다음 프롬프트를 사용하여 장인의 외모를 약간 바꿀 것입니다.

제공된 이미지를 사용하여 왁스 라인을 그리는 동안 장인의 코에 얇은 독서 안경을 부드럽게 놓습니다. 반사가 현실적으로 보이고 안경은 눈을 가리지 않고 얼굴에 자연스럽게 앉아 있습니다.

결과 이미지는 다음과 같습니다.

페르시아 파나

위의 이미지는 첫 번째 이미지와 동일하지만 장인의 얼굴에 안경이 추가됩니다. 이는 Nano-Banana가 설명 프롬프트를 기반으로 이미지를 편집하면서 전반적인 일관성을 유지하는 방법을 보여줍니다.

파이썬으로이를 수행하려면 다음 코드를 사용하여 기본 이미지와 새 프롬프트를 제공 할 수 있습니다.

from PIL import Image

# This code assumes 'client' has been configured from the previous step
base_image = Image.open('/path/to/your/photo.png')
edit_prompt = "Using the provided image, place a pair of thin reading glasses gently on the artisan's nose..."


response = client.models.generate_content(
    model="gemini-2.5-flash-image-preview",
    contents=[edit_prompt, base_image])

다음으로, 장인이 카메라를 직접보고 웃는 새로운 장면을 생성하여 캐릭터 일관성을 테스트합시다.

제공된 이미지를 정체성에 대한 참조로 사용하여 새롭고 사진적 이미지를 생성하십시오. 동일한 Batik Artisan은 이제 같은 나무 테이블에 앉은 편안한 미소로 카메라를 바라보고 있습니다. 중간 클로즈업, 부드러운 베란다 조명으로 85mm 외관, 배경 항아리가 미묘하게 흐려졌습니다.

이미지 결과는 다음과 같습니다.

페르시아 파나

캐릭터 일관성을 유지하면서 장면을 성공적으로 변경했습니다. 보다 과감한 변화를 테스트하려면 다음 프롬프트를 사용하여 Nano-Banana의 성능을 확인하십시오.

제공된 이미지를 ID 참조로 사용하여 제품 스타일 이미지를 만듭니다. 완성 된 INDIGO BATIK 천을 제시하는 동일한 장인, 팔이 카메라를 향해 확장되었습니다. 부드럽고 창문 조명, 50mm 모양, 중립적 인 배경 혼란.

결과는 다음과 같습니다.

페르시아 파나

결과 이미지는 완전히 다른 장면을 보여 주지만 동일한 문자를 유지합니다. 이것은 단일 참조 이미지에서 다양한 컨텐츠를 현실적으로 생성하는 모델의 능력을 강조합니다.

다음으로 이미지 스타일 전송을 시도해 봅시다. 우리는 다음 프롬프트를 사용하여 사진 이미지를 수채화 그림으로 변경합니다.

제공된 이미지를 정체성 참조로 사용하여 콜드 프레스 종이의 섬세한 수채화로 장면을 재현하십시오. 천을위한 느슨한 인디고, 꽃 모티프의 부드러운 출혈 가장자리, 테이블의 창백한 움버 및 배경. 그녀의 포즈는 직물, 부드러운 미소, 둥근 안경을 유지하십시오. 베란다가 가벼운 과립과 눈에 보이는 종이 질감으로 물러나게하십시오.

결과는 다음과 같습니다.

페르시아 파나

이미지는 스타일이 원본의 주제와 구성을 유지하면서 수채화로 변형되었음을 보여줍니다.

마지막으로, 우리는 이미지 퓨전을 시도 할 것입니다. 여기서 한 이미지의 객체를 다른 이미지에 추가합니다. 이 예에서는 Nano-Banana를 사용하여 여성 모자 이미지를 생성했습니다.

페르시아 파나

모자의 이미지를 사용하여 이제 다음과 같은 프롬프트와 함께 장인의 머리에 배치합니다.

같은 여자를 움직이고 야외에서 열린 그늘로 포즈를 취하고 머리에 제품 이미지에서 밀짚 모자를 놓습니다. 크라운과 챙을 머리에 현실적으로 정렬하십시오. 그녀의 오른쪽 귀 (카메라 왼쪽) 위로 절을하고 리본 꼬리는 중력으로 부드럽게 표류합니다. 밝은 배경에서 부드러운 림으로 부드러운 하늘색을 키로 사용하십시오. 진정한 빨대와 레이스 질감, 자연 피부 톤 및 안경의 이마와 꼭대기 위의 챙에서 믿을 수있는 그림자를 유지하십시오. 바틱 천과 그녀의 손을 변하지 않도록하십시오. 수채화 스타일을 변경하지 않도록하십시오.

이 프로세스는 모자 사진을 기본 이미지와 병합하여 포즈와 전체 스타일을 최소화하면서 새로운 이미지를 생성합니다. 파이썬에서 다음 코드를 사용하십시오.

from PIL import Image

# This code assumes 'client' has been configured from the first step
base_image = Image.open('/path/to/your/photo.png')
hat_image = Image.open('/path/to/your/hat.png')
fusion_prompt = "Move the same woman and pose outdoors in open shade and place the straw hat..."

response = client.models.generate_content(
    model="gemini-2.5-flash-image-preview",
    contents=[fusion_prompt, base_image, hat_image])

최상의 결과를 얻으려면 최대 3 개의 입력 이미지를 사용하십시오. 더 많이 사용하면 출력 품질이 줄어 듭니다.

이는 Nano-Banana 모델 사용의 기본 사항을 다룹니다. 내 생각에,이 모델은 변환하거나 편집하려는 기존 이미지가있을 때 탁월합니다. 일련의 생성 된 이미지에서 일관성을 유지하는 데 특히 유용합니다.

첫 번째 시도에서 완벽한 이미지를 얻지 못하기 때문에 직접 시도하고 반복하는 것을 두려워하지 마십시오.

틀 마무리

Gemini 2.5 Flash Image 또는 Nano-Banana는 Google의 최신 이미지 생성 및 편집 모델입니다. 이전 이미지 생성 모델에 비해 강력한 기능을 자랑합니다. 이 기사에서는 Nano-Banana를 사용하여 이미지를 생성 및 편집하는 방법을 살펴보고 일관성을 유지하고 스타일 변경을 적용하는 기능을 강조했습니다.

이것이 도움이 되었기를 바랍니다!

Cornellius Yudha Wijaya 데이터 과학 보조 관리자 및 데이터 작성자입니다. 그는 Allianz Indonesia에서 풀 타임으로 일하는 동안 소셜 미디어 및 작문 미디어를 통해 Python과 데이터 팁을 공유하는 것을 좋아합니다. Cornellius는 다양한 AI 및 기계 학습 주제에 대해 글을 씁니다.

출처 참조