Gemini Omni! 영상계의 나노 바나나 — 코드팩토리 실사용 리뷰
Gemini-Omni 발표 직후 코드팩토리가 직접 실험한 결과를 공유한 리뷰 영상. 텍스트 프롬프트로 영상 배경을 변환하는 기능을 여러 시나리오로 테스트한 실용적 사용기.
IDEAS
- Gemini-Omni는 텍스트 프롬프트만으로 기존 영상의 배경·스타일을 변환하는 AI 영상 편집 모델
- 구글 공식 프로모션 영상과 실제 사용 결과 사이에는 상당한 품질 갭이 존재
- Gemini Omni는 영상을 분석한 뒤 원본을 보존하는 게 아니라 아예 재구성하는 방식으로 동작
- Nano-Banana(나노바나)와 유사하게 원본 요소가 달라지는 특성이 있음
- 레퍼런스 이미지를 함께 제공해도 정확도가 크게 개선되지 않음
- 원본의 인물·아이템을 그대로 유지하라는 명시적 지시도 잘 지켜지지 않음
- 여러 배경 테마를 시간 구간(2.5초 단위)별로 설정하는 기능을 지원
- 귀멸의 칼날 등 참조 스타일 이미지를 넣으면 스타일은 살리지만 정확도는 낮음
- 서버 부하(출시 직후)로 처리 시간이 길어 반복 이터레이션이 어려운 상황
- 반복 이터레이션과 프롬프트 엔지니어링으로 결과를 점진적으로 개선 가능
- AI-UGC 광고 제작에 활용 가능성이 있음 — 인플루언서 계약 대비 비용 효율
- UGC 광고처럼 정확도보다 다양성이 필요한 영역에서 적합
- 단순 브이로그에서 특정 요소 하나만 제거·변경 시에는 기존 편집툴보다 효율적일 수 있음
- Gemini Ultra 플랜(Flow 포함) 사용자도 접근 가능
- 현재 기능은 안정적이지 않으나 빠르게 개선될 것으로 기대
INSIGHTS
- 프로모션 vs 실제 성능 갭: AI 영상 도구는 발표 시연과 실제 사용 간 품질 차이가 크다 — 직접 테스트가 반드시 필요
- 재구성 패러다임: Gemini Omni는 원본 보존이 아니라 재해석·재구성 방식 — 원본 충실도보다 창의적 변형에 적합
- 적합한 용도 선정이 핵심: 복잡한 요소 유지가 필요한 편집에는 부적합, 단순 스타일 변환이나 UGC 생성에 유리
- 이터레이션 전략: 한 번에 완벽한 결과를 기대하기보다 반복 수정 루프를 설계해야 함
- AI 영상 편집의 진입 장벽 하강: 전문 편집 도구 없이도 간단한 영상 변환이 가능해지는 추세
QUOTES
“프로모션에서 봤던 거랑 너무 차이가 많이 나니까”
“나노바나도 얼굴을 그대로 넣어도 약간 바뀌어서 나오잖아요. 근데 여기서도 보면은 조금 바뀝니다.”
“우리가 원하는 대로 그냥 한 번에 나오는 느낌까지는 아니다”
“인플루언서 뭐 계약하고서 하는 것보다 그냥 돈 내고서 내가 만들어 가지고 광고 태우고 싶다라고 하면은 조금 유용할 수도 있지 않을까”
“몇 번 이터레이션 하면은 충분히 변경할 수 있는 요소인 거 같아요”
REFERENCES
- Gemini-Omni — 리뷰 대상 AI 영상 생성·편집 모델
- Nano-Banana — 비교 대상 AI 영상 생성 도구 (원본 보존 미흡 특성 공유)
- video-generation — AI 영상 생성 개념
- AI-UGC — 활용 가능 사례로 언급된 광고 형태
- Google-Flow — Gemini Ultra 플랜 포함 서비스
FACTS
- 영상 업로드일: 2026-05-20 (O 2026 직후)
- 영상 길이: 506초 (~8.4분)
- 테스트 시나리오: 오피스 배경 스냅 변환, 책장 배경 변환, 귀멸의 칼날 스타일 운동 영상, 일하는 척 키보드 영상
- Gemini Ultra 플랜 사용자는 Flow를 통해 접근 가능
- 여러 배경 테마를 2.5초 단위로 설정하는 기능 지원 확인
- 출시 직후 서버 부하로 처리 속도 저하