토큰값 0원! 구글 Gemma 4로 나만의 AI 코딩 에이전트 육성하기 EP.2

Source: 2026-04-09-connect-ai-lab-gemma4-agent-ep2 Type: YouTube By: CONNECT AI LAB Valid as of: 2026-04-09 Duration: 24:03

핵심 Takeaway

  • 안티그래비티(Anti-Gravity) 바이브 코딩 툴에 로컬 Gemma 4를 연결하는 방법을 시연하며, 토큰 소진 없이 코드를 생성·수정한다.
  • 비용 최적화 전략: “로컬 Gemma 4로 초기 코드 생성 → 고급 클라우드 AI(Claude/Gemini)로 업그레이드” 순서가 토큰 사용량을 크게 줄인다.
  • antigraviconfig.jsontemperature 파라미터를 0.1로 설정하면 코딩 에이전트의 창의성 과잉을 제어할 수 있다.
  • Gemma 4 vs Gemini 3.1 Pro vs Claude Opus 웹사이트 생성 비교: 기본 기능 구현은 Gemma 4로 가능, 고품질 디자인은 클라우드 AI 활용.
  • AI 1인 기업의 핵심 원칙: “꼭 필요한 작업에만 클라우드 AI, 반복·간단 작업은 로컬 AI” — 비용 체적화(Cost Optimization).

상세 요약

안티그래비티 + Ollama 연결 구조

에이전트 기반 바이브 코딩 툴인 안티그래비티(Anti-Gravity)는 내장 AI 모델(Gemini, Claude, GPT) 사용 시 토큰이 소비된다. ollama를 서버로 실행하고, 안티그래비티 설정 파일(antigraviconfig.json)을 통해 로컬 gemma-4로 연결하면 토큰 소진 없이 코딩이 가능하다.

토큰 소비 구조: 명령 입력 시 + AI 응답 생성 시 모두 토큰 소비. 로컬 모델은 이 두 단계 모두 내 컴퓨터에서 처리.

antigraviconfig.json 설정

{
  "model": "gemma4:4b",
  "temperature": 0.1
}
  • model: 사용할 Ollama 모델 이름 (2B 사용 시 gemma4:2b)
  • temperature: 0에 가까울수록 일관된 결과, 1에 가까울수록 창의적. 코딩 에이전트에는 0.1 권장
  • 안티그래비티에서 @LOCAL 커맨드로 로컬 모델로 전환

웹사이트 개발 3종 비교 (2026-04-09 기준)

모델결과특징
gemma-4 (로컬)기본 미래지향 웹사이트 + 애니메이션무료, 오프라인, 기능 구현 가능
Gemini 3.1 Pro화려한 애니메이션, 세련된 디자인토큰 소비, 클라우드
Claude Opus”Welcome to the Construct” 컨셉토큰 소비, 클라우드

비용 최적화 전략 (Cost Optimization)

AI 1인 기업 운영의 핵심 원칙 3단계:

  1. 초기 코드 생성: 로컬 Gemma 4로 베이스 코드 생성 (토큰 0)
  2. 업그레이드: Gemini/Claude로 디자인·기능 고도화 (토큰 최소 소비)
  3. 세부 수정: 색상 변경, 숫자 수정 등 디테일은 다시 로컬 Gemma 4 (토큰 0)

“AI 1인 기업도 항상 Claude를 사용할 필요 없고 항상 Gemini 3.1 Pro를 사용할 필요가 없습니다.” (출처: 2026-04-09 영상)

이 전략은 vibe-coding의 비용 측면을 구체화한 실전 워크플로우다.

연결되는 위키 페이지