수업 #16 — 토큰 어디서 새는 거야?

Source: bbojjak-viewer.vercel.app/lessons/lesson-16 Type: article By: 뽀짝이 / 뽀짝이의 서재 (지피터스 AI스터디) Valid as of: 2026-04-28

Key Insight

AI 에이전트의 토큰은 “코드 짜기”보다 “읽기(CLI 출력·API 응답)“에 더 많이 소비된다. RTK로 CLI 출력을 60~90% 압축하고, hook이 안 되면 AGENTS.md 지침으로 동일 효과를 낸다. “자동화가 안 되면 규칙으로.”

핵심 Takeaway

토큰 소비처 5순위: CLI 출력(1위) > API 응답 > 파일 반복 읽기 > 대화 히스토리 > 시스템 프롬프트. 실제 필요 정보는 CLI 출력의 20~30%뿐 (출처: “토큰이 새는 곳을 찾아라” 섹션)
RTK = CLI 출력 압축 프록시: rtk git status 2,074자 → 457자 (78% 감소). brew install rtk-ai/tap/rtk && rtk init --global 2줄 설치. 30개+ 명령 지원 (출처: “RTK — 토큰 킬러 등장” 섹션)
hook vs 지침 차이: Claude Code는 PreToolUse hook으로 자동 치환. OpenClaw exec는 hook 경로 외부 → AGENTS.md에 “rtk 접두어 붙이기” 지침 한 줄로 동일 효과. “자동화가 안 되면 규칙으로” (출처: “Claude Code에서는 자동, OpenClaw에서는?” 섹션)
14일 토큰 대시보드: 뽀짝이 75%·하트비트 27%·Opus 85%. → 하트비트 Sonnet 전환(1/5 비용), 시스템 프롬프트 390→161줄 다이어트, 장시간 세션 분할 (출처: “타타의 질문” 섹션)
능동적 compact 원칙: 95% 자동 컴팩션 전 10만 토큰에서 능동 compact, 15만에서 메모리 기록 후 세션 정리. 자동 컴팩션은 맥락 유실 위험 (출처: “RTK 말고도” 섹션)

AI 에이전트에서 “코드를 짜는 데 드는 토큰”보다 “코드를 짜기 위해 읽는 것에 드는 토큰”이 더 많다.

→ 개선 포인트: 하트비트 Sonnet 전환(비용 1/5), 시스템 프롬프트 다이어트, 장시간 세션 분할

rtk git status
→ 불필요한 안내 메시지·스테이징 가이드 제거
→ 핵심 변경 파일 목록만 출력
→ 2,074자 → 457자 (78% 감소)

rtk gain 누적 확인: 11회 실행, 3.8K 토큰(80.2%) 절약.

교훈: 시스템 구조(hook)로 자동화할 수 없으면, 에이전트에게 규칙(AGENTS.md)으로 행동을 지시해도 같은 효과를 낼 수 있다. 이는 harness-engineering의 “지침 vs 시스템 2중 방어선”의 실전 적용이다.

agent-token-optimization — 이 소스에서 추출한 토큰 최적화 전략
harness-engineering — hook vs AGENTS.md 지침 대안 (지침이 hook과 동일 효과)
agent-memory-architecture — 능동적 compact 전략; 15만 토큰 기준 메모리 기록
subagent-orchestration — 서브에이전트 Sonnet 전환 = 비용 절감 + 새 컨텍스트
agent-runtime-architecture — 시스템 프롬프트 매 턴 주입 = 토큰 기본 비용
bbojjak-openclaw-agentic-architecture-lesson01 — 시리즈 Lesson 01
bbojjak-openclaw-subagent-orchestration-lesson12 — 시리즈 Lesson 12 (서브에이전트·모델 선택)
bbojjak-openclaw-agent-security-lesson17 — 시리즈 Lesson 17 (프롬프트 인젝션·보안 3원칙·에이전트 분리·심층 방어)
bbojjak-openclaw-skill-ecosystem-lesson18 — 시리즈 Lesson 18 (보안 스킬 선택 3단계·구조>스킬·즉시 학습+SSOT·오픈 생태계 신뢰 평가)
bbojjak-openclaw-resilience-failover-lesson19 — 시리즈 Lesson 19 (Model Failover·세션 스티킨스·Agent Loop·작업별 모델 분리·34% 절감)
bbojjak-openclaw-information-boundary-lesson20 — 시리즈 Lesson 20 (분리 이후 운영·일방향 동기화·민감정보 추출·에스컬레이션·오탐 관리)