Google의 AI 모델은 스푸핑 전화 사진에 정말 능숙해졌습니다.
저는 Google의 시각적 AI 모델이 어디서 그 이름을 얻었는지 이해하기 시작했습니다. 왜냐하면 며칠 동안 이 모델을 가지고 놀고 난 후 요약하자면 바나나였습니다. 그것이 생성하는 이미지는 바나나처럼 현실적입니다. 너무 오랫동안 쳐다보고 나면 바나나가 될 것 같은 느낌이 듭니다. 그리고 Nano Banana Pro의 이미지가 이전의 AI 슬롭보다 훨씬 더 현실적으로 보이는 이유 중 하나를 정확히 지적해야 한다면 그것은 이것이다: 휴대폰 카메라로 찍은 사진처럼 보입니다.
물론, 찾아보면 거기에 텔이 있습니다. 이 기사 상단에 있는 도시 보도에 있는 (진짜는 아닙니다!) 커플의 이미지를 찍으세요. 배경의 가로등은 나에게 그다지 적합해 보이지 않으며 일부 건물 정면(특히 배경으로 더 멀리 있음)이 약간 이상하고 뭉툭해 보입니다. 하지만 소셜 미디어에서 이 사진을 그냥 스크롤해서 지나쳤다면? 절대로 AI로 기록하지 않을 것입니다. 피사체는 사실적으로 보이지만 이미지가 너무 완벽해 보이지 않는다는 점이 매력인 것 같아요.

밝고 평탄한 노출, 넉넉한 피사계 심도, 약간 바삭바삭한 디테일: 이 모든 것이 제게는 휴대폰 카메라를 연상시킵니다. 인기 있는 iPhone 카메라 앱 Halide의 공동 창업자인 Ben Sandofsky도 이에 동의합니다. 위 AI가 생성한 여객선 이미지에서 그는 “스마트폰 사진에서 볼 수 있는 공격적인 이미지 샤프닝은 이미지를 ‘팝’하게 만드는 데 도움이 되는 시각적 트릭”이라고 지적했다. 휴대폰으로 찍은 사진의 또 다른 특징은? 소음. “대부분의 AI 생성 사진은 너무 깨끗하다고 느껴집니다. 이 사진의 질감은 작은 스마트폰 센서에서 나온 것처럼 느껴집니다.”

그렇다면 Google의 AI는 휴대전화 사진에 대한 개념을 어디서 가져오는 걸까요? Google 포토는 분명하고 문제가 많은 곳처럼 보이지만 Gemini 앱의 글로벌 커뮤니케이션 관리자인 Elijah Lawal은 “Nano Banana의 경우 Google 포토를 사용하지 않습니다”라고 말합니다. 그는 또한 Nano Banana Pro가 휴대폰 카메라 모양을 만드는 데 특별히 초점을 맞추지 않았다고 말했습니다. “가장 큰 개선점 중 하나는 Google 검색에 연결할 수 있다는 점입니다.”라고 그는 말합니다. 오늘 날씨에 대한 인포그래픽을 생성하라는 메시지를 표시하면 기온을 검색할 수 있습니다. 이전에는 메시지에 더 많은 정보를 포함해야 했습니다.
Lawal에 따르면 이는 이미지 검색이 아닌 텍스트 검색으로 제한됩니다. 하지만 할 수 있다는 것 가서 얻으세요 여기서는 실제 정보 자체가 핵심 요소가 될 수 있습니다. Nano Banana Pro는 특별히 요청한 적이 없더라도 이미지에 해당 맥락에 맞는 항목을 추가하는 데 특히 좋습니다. 명시적으로 지시하지 않고도 시대에 맞는 옷이나 자동차와 같은 역사적 요소를 추가할 수 있습니다. 시애틀의 가짜 주택에 대한 가짜 Zillow 목록을 생성해 달라고 요청했을 때 Northwest Multiple Listing Service에 대한 워터마크도 추가했습니다. 과제를 이해하고 메시지를 받지 않고도 작은 세부 사항을 추가하는 것이 훨씬 더 좋아지고 있습니다.

이미지: 나노 바나나 프로
나는 Gemini에게 서부 시애틀에 있는 흰색 페인트와 검은색 장식이 있는 장인 스타일의 주택에 대한 Zillow 목록을 요청했습니다. 장소를 설명하는 장황한 텍스트 전용 목록을 제공했지만 또 다른 프롬프트로 Nano Banana Pro를 사용하여 설명과 어울리는 이미지를 만들었습니다. 제가 특별히 요청한 것은 아니지만 이미지에는 2023년 저작권이 포함되어 있습니다. 이는 매우 우스꽝스럽습니다. 그리고 기본적으로 시애틀 광역 지역에서 찾을 수 있는 모든 부동산 사진에 있는 것과 같은 워터마크가 있습니다. 흥미롭게도 그것은 현재의 로고가 아니라 이전 버전인데, 2018년에 구입한 집 사진마다 똑같은 로고가 붙어 있습니다.
저는 Google에 Nano Banana가 어디에서 나올 수 있는지 물었고 DeepMind 제품 관리자인 Naina Raisinghani는 이것이 환각이라고 제안하며 다음과 같이 말했습니다: “Nano Banana Pro는 문자 일관성, 이미지 생성 및 검색 기반 정확성에 대한 주요 업그레이드를 제공합니다. 이것이 현재까지 가장 정확한 이미지 모델이지만 AI 환각이 발생할 수 있습니다. 이미지가 완전히 옳지 않은 경우, 후속 시도에서 의도에 더 일치하는 결과를 얻을 수 있기 때문에 다시 시도하는 것이 좋습니다.” 문제는 부동산 목록 서비스에 워터마크를 추가하는 것이 의도한 대로 정확히 작동하는 모델처럼 보인다는 것입니다.
워터마크가 있든 없든, “판매용” 표지판의 작은 글씨가 이것을 AI로 알려줄 수도 있고, 현관에 화분에 심은 식물이 조금 너무 완벽해 보일 수도 있지만 솔직히요? 나는 이 집이 진짜가 아니라는 것을 뼈속으로 알면서도 이 집이 진짜가 아니라고 믿기가 어렵습니다. 부동산 웹사이트에서 우연히 발견하더라도 다시 생각하지 않을 것이며 워터마크는 확실히 그것을 진품으로 판매하는 데 도움이 될 것입니다. AI가 사진이 실제임을 나타내는 것을 모방하는 데 능숙해지면 여러분: 우리는 익었습니다.

그것이 제가 가장 걱정하는 점입니다. AI가 알려주는 것이 점점 더 찾기 어려워지고 Nano Banana가 이미지를 실제처럼 보이게 만드는 작은 세부 사항을 더 잘 모방하고 있다는 것입니다. 우리는 그것을 묘사하기 위해 모호한 프롬프트를 주었습니다. 가장자리 라이브 이벤트를 취재하는 기자; 마이크와 같은 세부 정보를 추가했습니다. 가장자리 기자의 손에는 로고가 있고 화면 하단에는 키론이 있습니다. 철자가 틀리거나 외계인처럼 보이는 글자가 없습니다. 여섯 손가락을 가진 손은 없습니다. AI로서 명백하게 정보를 제공할 수 있는 정보는 없으며 실제 거래로 판매할 수 있는 작은 세부 정보도 많이 있습니다.
1년 전, 심지어 몇 달 전에도 나는 미래에 언젠가는 올 날, 달리 입증되지 않는 한 낯선 출처에서 온라인으로 본 사진이나 비디오를 믿는 것이 현명하지 않을 날이 올 것이라는 느낌을 받았습니다. 이 훈련을 통해 저는 그날이 미래가 아니라는 확신을 갖게 되었습니다. 지금 여기 있어요. AI 레이더를 적절하게 조정하고 약간의 바나나를 몰아도 놀라지 마십시오.



Post Comment