수업 #5 — AI는 왜 같은 실수를 안 할까?
Source: bbojjak-viewer.vercel.app/lessons/lesson-05 Type: article By: 뽀짝이 / 뽀짝이의 서재 (지피터스 AI스터디) Valid as of: 2026-04-28
Key Insight
AI 에이전트가 같은 실수를 반복하지 않는 비결은 AGENTS.md의 절대 규칙이다. 핵심 원칙: “알고 있다 ≠ 실행한다” — 추상적 원칙은 해석 실패로 이어지므로, 사고에서 탄생한 구체적 규칙(1차 방어선) + 실행 경로 제거(2차 방어선 시스템)의 2중 방어선이 필요하다.
핵심 Takeaway
- AGENTS.md = 에이전트 업무 매뉴얼: SOUL.md(정체성)와 분리된 행동 규칙 파일. 세션 절차·메모리 규칙·팀원 권한·절대 규칙 수록. “SOUL.md가 DNA라면 AGENTS.md는 사내 업무 매뉴얼” (출처: “AGENTS.md” 섹션)
- 절대 규칙 = 사고 현장에서 탄생한 구체적 금지 규칙: 실수→원인분석→구체 규칙 작성→AGENTS.md 추가 루프. 9일에 0→14개 성장. 구체성이 핵심 (출처: “절대 규칙” 섹션)
- “알고 있다 ≠ 실행한다”: 추상적 원칙은 AI가 해석해야 하므로 실패 가능. 구체적 규칙은 해석 여지 없이 실행. “반복을 피하라”(실패) vs “최초 1회만 + 메모리 확인”(성공) (출처: “알고 있다 ≠ 실행한다” 섹션)
- 지침 vs 시스템 — 2중 방어선: 절대 규칙(1차·AI 매번 판단) + 시스템 구조적 제거(2차·판단 불필요). 위험도 높은 사항은 두 방어선 모두 적용. HEARTBEAT.md 항목 삭제 = 실행 경로 자체 제거 (출처: “지침 vs 시스템” 섹션)
- 사고 루프 = 에이전트 강화: AGENTS.md가 조직의 실수 DB. “사고를 칠수록 에이전트가 강해진다.” 중요한 건 같은 실수의 반복 여부 (출처: “사고뭉치인 게 나쁜 건가요?” 섹션)
상세 요약
SOUL.md vs AGENTS.md 역할 분리
| 파일 | 비유 | 내용 |
|---|---|---|
| SOUL.md | DNA / 성격 | 정체성, 말투, 미션, 페르소나 |
| AGENTS.md | 사내 업무 매뉴얼 | 절차, 금지사항, 절대 규칙, 권한 체계 |
두 파일의 역할 분리는 agent-identity-design(SOUL.md)과 agent-error-learning-loop(AGENTS.md 절대 규칙)으로 각각 다룬다.
절대 규칙 3가지 실전 사례
A — 시간대 미명시 → 새벽 0시 아침 브리핑
- 원인: HEARTBEAT.md에 “아침 브리핑 보내라”만 있고 시각 조건 없음
- 규칙: “KST 08:30~09:30 사이에만. 시간대 밖이면 절대 발송 금지”
- 교훈: 조건부 실행은 조건을 명시하지 않으면 항상 실행된다
B — 상태 추적 없음 → 오류 15회 반복 보고 (🚨🚨🚨)
- 원인: 하트비트 루프가 “확인→에러→보고”를 상태 저장 없이 반복
- 규칙: “최초 1회만. 메모리 파일로 ‘이미 보고했는지’ 반드시 확인”
- 교훈: 루프 기반 에이전트는 반드시 상태 기억(memory/) 필요
C — 즉답 욕구 → 기억 의존 오답
- 원인: 확인 30초 절약을 위해 기억에 의존한 즉답
- 규칙: “일정/시간/숫자는 원본 데이터 조회 후 작성. 기억 의존 즉답 절대 금지”
- 교훈: 정확성 > 속도. “1분 늦더라도 정확한 것이 100배 낫다”
2중 방어선 설계
위험도 낮은 상황: 절대 규칙(1차)만으로 충분
위험도 높은 상황: 절대 규칙(1차) + 시스템(2차) 이중 적용
매출 리포트 중복 발송 사례:
- 1차(지침): AGENTS.md에 “중복 발송 금지” 명시
- 2차(시스템): HEARTBEAT.md에서 매출 리포트 항목 아예 삭제 → 판단 자체 불필요
시스템(2차)이 강력한 이유: 실행 경로를 단일화하면 “판단 놓침”이라는 취약점이 사라진다.
AGENTS.md = 조직의 실수 DB
이 관점은 harness-engineering의 CLAUDE.md 운영 철학과 동일하다:
- “같은 실수를 2번 반복하면 CLAUDE.md에 규칙 추가”
- AGENTS.md 절대 규칙 = CLAUDE.md 지침의 에이전트 버전
에이전트가 오래될수록 AGENTS.md가 두터워진다 = 조직 경험이 코드화된다.
연결되는 위키 페이지
- agent-error-learning-loop — 이 소스에서 추출한 절대 규칙 탄생 루프
- harness-engineering — CLAUDE.md = SOUL.md + AGENTS.md 역할; 동일한 “같은 실수 → 규칙 추가” 원칙
- agent-workspace-structure — AGENTS.md가 포함된 워크스페이스 7종 파일
- agent-identity-design — SOUL.md 역할 (AGENTS.md와 쌍)
- bbojjak-openclaw-agentic-architecture-lesson01 — 시리즈 Lesson 01
- bbojjak-openclaw-soul-md-lesson02 — 시리즈 Lesson 02
- bbojjak-openclaw-webhook-pipeline-lesson03 — 시리즈 Lesson 03
- bbojjak-openclaw-multi-agent-team-lesson04 — 시리즈 Lesson 04
- bbojjak-openclaw-session-architecture-lesson06 — 시리즈 Lesson 06 (세션·컴팩션·채널 라우팅)
- bbojjak-openclaw-runtime-architecture-lesson07 — 시리즈 Lesson 07 (터미널 vs 런타임 아키텍처 비교)
- bbojjak-openclaw-memory-architecture-lesson08 — 시리즈 Lesson 08 (기억 3단계·Full-context·Prompt Caching)
- bbojjak-openclaw-scheduling-design-lesson09 — 시리즈 Lesson 09 (하트비트 vs 크론잡·3가지 사고·스케줄링 설계)
- bbojjak-openclaw-skill-design-lesson10 — 시리즈 Lesson 10 (에이전트 스킬 시스템·SKILL.md·n8n→스킬 전환)
- bbojjak-openclaw-automation-layers-lesson11 — 시리즈 Lesson 11 (exec·자동화 3계층·exec-approvals·Trust but verify)
- bbojjak-openclaw-subagent-orchestration-lesson12 — 시리즈 Lesson 12 (sessions_spawn·맥락의 격차·판단 최소화 원칙)
- bbojjak-openclaw-playwright-image-pipeline-lesson13 — 시리즈 Lesson 13 (Playwright·HTML→PNG·browser 도구·디자인 시스템)
- bbojjak-openclaw-gateway-architecture-lesson14 — 시리즈 Lesson 14 (Gateway·멀티채널 라우팅·Tailscale Funnel·보안 4중 잠금)
- bbojjak-openclaw-multichannel-session-lesson15 — 시리즈 Lesson 15 특별편 (Slack 스레드·텔레그램 토픽 세션 분리·DM 함정·bindings)
- bbojjak-openclaw-token-optimization-lesson16 — 시리즈 Lesson 16 (토큰 소비처 5순위·RTK·hook vs 지침·능동적 compact·Sonnet 전환)
- bbojjak-openclaw-agent-security-lesson17 — 시리즈 Lesson 17 (프롬프트 인젝션·보안 3원칙·에이전트 분리·심층 방어)
- bbojjak-openclaw-skill-ecosystem-lesson18 — 시리즈 Lesson 18 (보안 스킬 선택 3단계·구조>스킬·즉시 학습+SSOT·오픈 생태계 신뢰 평가)
- bbojjak-openclaw-resilience-failover-lesson19 — 시리즈 Lesson 19 (Model Failover·세션 스티킨스·Agent Loop·작업별 모델 분리·34% 절감)
- bbojjak-openclaw-information-boundary-lesson20 — 시리즈 Lesson 20 (분리 이후 운영·일방향 동기화·민감정보 추출·에스컬레이션·오탐 관리)