구글 VIP 파티에서 도망친 이유 — 전 세계 최초 시연 ‘제미나이 옴니’
EP.2 구글 I/O 실리콘밸리 | CONNECT AI LAB | 2026-05-19 | 6분 13초
요약
Google I/O 2026 기조연설 직전, 발표자가 Gemini-Omni 를 사전 접근권으로 직접 시연한 영상. 대화형 인터페이스로 영상을 생성·편집하는 새로운 패러다임을 보여주며, Veo 3 (VO3)와 다른 질감의 영상 품질을 확인함.
IDEAS
- Gemini-Omni 는 텍스트·사진·영상을 입력받아 대화하듯 영상을 생성·편집하는 AI 모델
Create Video → Omni인터페이스에서 영상 삽입 후 프롬프트로 장면 변환 가능- 세계 지식(물리법칙, 역사, 생물학, 문화)을 통합하여 맥락 있는 영상 생성
- 사용자 사진을 기존 영상 장면에 자연스럽게 합성 가능
- Veo 3 (VO3)와 다른 질감·공간감·음향 특성을 보임 — 영상 생성 AI 경쟁 가속
- Google-IO-2026 공식 발표 전 콘텐츠 크리에이터에게 사전 접근권 제공 (마케팅 전략)
- 네이티브-멀티모달 개념 실증: AI가 단순 계산이 아니라 세상을 이해하고 상상
- AI 에이전트 강의 수요 증가 — 유튜브 크리에이터 대상 전문 교육 필요
- 샌프란시스코가 AI 테크 변화의 가장 빠른 진원지
INSIGHTS
- 영상 생성 AI의 패러다임 전환: 단순 텍스트→영상에서 ‘대화형 편집 루프’로 — 사용자가 중간에 개입하며 반복 수정하는 창작 워크플로우가 가능해짐
- 세계 모델(World Model)의 실용화: AI의 물리·문화 이해 능력이 영상 합성 자연스러움을 결정하는 핵심 변수로 부상
- AI 기술 수용 프레임: 기술 탐구에 그치지 않고 “생존·사업·수익”으로 연결해야 한다는 크리에이터 관점
QUOTES
“인공지능은 사실은 뭔가를 엄청나게 계산을 하는게 아니라 세상을 이해하고 꿈을 꾸고 상상을 한다.”
“AI 테크 쪽에서 샌프란시스코가 가장 빠르게 변하고 있고 그거를 최대한 여러분들에게 보여 드리고 싶어서 이걸 하는 거예요.”
“이거를 가지고 어떻게 내가 생존할지, 어떻게 사업할지, 어떻게 돈을 벌 수 있을지 그것에 대해서 계속 고민하고 만들어 보시고 하셔야 됩니다.”
REFERENCES
- Gemini-Omni — Google의 새로운 대화형 영상 생성 AI 모델
- Google-IO-2026 — 2026년 구글 개발자 대회, 샌프란시스코
- 네이티브-멀티모달 — 텍스트·이미지·영상을 통합 이해하는 AI 아키텍처 개념
- Veo 3 (VO3) — 기존 Google 영상 생성 모델 (비교 대상)
FACTS
- 업로드: 2026-05-19 | 조회수: ~7,961회
- Google I/O 2026 개최지: 샌프란시스코 (실리콘밸리)
- Gemini Omni 인터페이스:
Create Video → Omni메뉴 - 시연 예시: 사무실 영상 → “캐릭터가 슈퍼맨으로 바뀌어 창밖으로 날아가” → 변환 성공
- 사전 접근권(Early Access)을 일부 콘텐츠 크리에이터에게 제공