나는 Gemini가 내 사진을 편집하게했고 AI가 무엇을 좋아하는지 놀랐습니다.
요약
-
Gemini는 생산성 도구로 투구되었지만 Google은 이미지를 편집하는 데 더 나은 도구를 만들려고 노력하고 있습니다.
-
회사의 새로운 이미지 모델을 사용하면 Gemini의 프롬프트 상자에 입력하여 편집 할 수 있습니다.
-
Gemini는 크고 창의적 인 편집에 뛰어난 것으로 보입니다. 설득력있는 배경 변경 및 객체 제거.
-
AI는 정확한 조정을 시도 할 때 때때로 부족합니다.
Google 피치 쌍둥이 자리 올인원 생산성 도구로서, 평범한 사람의 개인적, 전문적, 창의적 삶의 여러 측면을 도울 수있는 것입니다. 그리고 회사가 AI 보조원을 보았고 모델이 그런 식으로 본 것이 확실하지 않다면 Google Workspace 전체에 Gemini를 삽입한다는 사실은 희망적으로 증거입니다. 그러나 회사의 믿음은 화재가없는 모든 연기가 아닙니다. Google은 Gemini가 캘린더 편집이나 올바른 설정에서 앱 내부에서 작업하는 것과 같은 일을 할 수 있음을 보여주기 시작했습니다. 그러나 이제 회사는 Gemini를 새로 사진으로 편집하기위한 더 나은 도구로 만드는 데 관심이 있습니다. “나노 바나나”이미지 모델.
AL의 약속 과이 업데이트 된 버전은 원하는 최종 이미지를 얻기 위해 특정 소프트웨어에 대한 경험이나 지식이 필요하지 않다는 것입니다.
자연어 사진 편집 – 사진이 어떻게 바뀌고 싶은지 쌍둥이 자리를 말하는 곳 – 회사의 피치의 일부였습니다. 픽셀 10그러나이 기능은 현재 Google 모델에 액세스 할 수있는 모든 장소에서 사용할 수 있습니다. 나는 당신의 편집이 마우스 나 스타일로 신체적으로 조작하는 것보다 당신의 편집을 말하거나 타이핑하는 것이 낫다는 것에 회의적이지만, Gemini의 새로운 기술을 시험해 보면 Gemini가 얼마나 많은 일을 할 수 있는지 감명 받았습니다.
Gemini 대 사진 편집 소프트웨어
AI가 사진을 편집하게하는 이유는 무엇입니까?
지금까지 Google의 Gemini 모델은 텍스트를 생성하고 대량의 데이터를 정렬하는 데 능숙한 것으로 입증되었습니다. Google이 Gemini “Multimodal”을 고려한 한 이미지를 이해하고 조작 할 수 있었지만 사진을 편집하는 간단한 행동은 여전히 더 빠릅니다. Photoshop, Photomator 또는 Lightroom.
AL의 약속 과이 업데이트 된 버전은 원하는 최종 이미지를 얻기 위해 특정 소프트웨어에 대한 경험이나 지식이 필요하지 않다는 것입니다. 당신이해야 할 일은 당신이 원하는 것을 분명히 묻는 것입니다. 그리고 Gemini는 나머지를 할 수 있어야합니다. 나는 Gemini의 개선 된 사진 기술을 염두에두고 실험하려고 노력했습니다. 내가보고 싶었던 편집물에 반드시 정확하지는 않지만 대신 각 사진에서 무엇이 보이는지에 대한 내 직감으로 모델을 촉구합니다.
Gemini가 간단한 편집으로 항상 최고는 아닙니다
이미지 모델은 작은 조정으로 어려움을 겪고 있습니다
iOS 용 Gemini 앱에 업로드 한 샘플 사진 모음을 사용하여 단순히 물어 보면 색상 및 화이트 밸런스와 같은 설정을 쉽게 조정할 수있었습니다. 때로는 Humane AI 핀을 착용 한 내 사진과 같이 때때로 변화가 상상했던 것보다 미묘했지만 항상 Gemini가 적어도 무언가를하려고하는 것처럼 보였습니다. 사진에서 객체의 방향을 바꾸는 것과 같이 AI 핀을 똑바로 펴도록 요청하여 왼쪽에 기대지 않도록하는 것과 같이 사진에서 객체의 방향을 변경하는 것과 같이 더 많은 일을 요청할 때 상황이 더 복잡해졌습니다. Gemini는 방금 할 수 없었습니다.
AI 조수는 이미지의 특정 부분 주위를 축소하고 자르는 데 상당히 유능했지만, 업로드 한 염소를 떼어내는 개 사진의 경우, 자른 이미지에는 Al 이미지와 관련된 말이 부드럽게 부드럽습니다. 이미지는 여전히 서비스가 가능하다고 생각하지만 Gemini가 스마트 폰이 캡처하지 않은 정보를 위해 작성하기 위해 생성하는 세부 사항이 항상 같은 품질은 아닙니다.
내 테스트를 바탕으로 이미지에 대해 잘못된 것인지 설명한 다음 Gemini에게 수정을 요구하는 것보다 더 나은 결과를 얻었습니다. Google 이미지 모델에서 원하는 것을 정확하게 얻으려면 후속 프롬프트가 필요할 것입니다. 내가 익숙한 편집 소프트웨어에서는 아마도 비슷한 결과를 더 빨리 얻을 수 있으며 일부 소프트웨어의 자동 수정 기능은 Gemini보다 더 잘 작동 할 수 있습니다.
더 크고 더 창의적 인 편집으로 Gemini는 훨씬 더 좋아집니다
아이디어가 더 광야할수록 이미지 모델이 더 잘 판매됩니다.
조정이 거의없는 대신 Google의 업데이트 된 이미지 모델이 실제로 뛰어난 것으로 보이는 것은 큰 문체적이고 창의적인 변화를 만드는 것입니다. 이미지를 완전히 재창조하거나 변경하려면 Gemini가 설득력있는 방식으로 할 수있는 좋은 기회가 있습니다 (상상할 수 있듯이 진실의 공유 개념에 좋지는 않습니다). 추가 프롬프트없이 Emus 사진에서 울타리를 제거 할 수 있었으며 최종 결과는 매우 자연스럽게 보입니다.
Gemini에게 샌프란시스코의 집 사진을 비오는 날에 찍은 것처럼 보이도록 보이도록 요청했습니다. 비슷한 성공을 거두었으며 조명 변경, 구름을 추가하기위한 배경 교체 및 가짜 비 효과가 완성되었습니다. 이 이미지는 면밀히 바라 보는 사람을 속이지 않을 수도 있지만 (Gemini Watermark도 죽은 선물이기도합니다) 소셜 미디어에서 스크롤하는 경우 설득력이 있습니다. 사람들은 이러한 이미지로 일정량의 창의적 라이센스를 기대하기 때문에 불일치를 간과하는 것이 더 쉽다고 생각합니다.
Gemini는 Photoshop의 간단한 대체물이 아닙니다
아직 창의적인 클라우드 구독을 취소하지 마십시오
이러한 실험을 바탕으로, 특히 간단한 조정을 원한다면 Gemini가 완벽한 사진 편집 도구라고 자신있게 말할 수는 없습니다. 여전히 일반 소프트웨어를 원할 것이며 휴대 전화의 사진 갤러리 앱의 내장 편집 도구만으로도 충분할 수 있습니다.

- 개발자
-
Google
- 구독 비용
-
무료, 더 많은 사용을 위해 $ 20/월
- 롤오버 크레딧
-
N/A
- 오프라인 다운로드
-
N/A
Gemini는 Android 운영 체제를위한 Google의 Premier AI Assistant 앱으로 질문에 대한 텍스트 응답을 제공하고 이미지를 생성 및 분석하며 iOS에서 사용할 수 있습니다.
그러나 더 많은 손을 대고있는 경우 Google의 이미지 모델이 야생 편집을위한 원 스톱 상점이되는 강력한 사례가 있다고 생각합니다. 이것 새로운 이미지 모델 평균 스마트 폰 사진 작가의 손이 닿지 않는 이미지를 만드는 데 꽤 잘 보이며 흥미로운 것을 발견하면 시도해 볼 가치가 있습니다.
Post Comment