LLM Wiki Starter Kit — 0에서 시작하는 개인 AI 지식베이스

한 줄 설명: “Claude Code + Obsidian으로 30분 안에 LLM Wiki를 설정하고, 첫 주 안에 운영 루틴을 확립하는 가이드”

이 가이드의 목표:

  1. 새로운 LLM Wiki 사용자가 처음부터 끝까지 자동으로 설정할 수 있는 “최소 필수 구성(Minimum Viable Wiki)“을 제공
  2. 자신의 도메인에 맞게 커스터마이징하는 방법을 단계별로 안내
  3. 첫 달 안에 지속 가능한 운영 습관을 만드는 방법 제시

최소 구성 (Minimum Viable Wiki)

필수 폴더 구조

your-new-wiki/
├── CLAUDE.md                    ← 세션 프로토콜 + 핵심 규칙
├── raw/                         ← Layer 1: 불변 원본
│   ├── articles/
│   ├── youtube/
│   └── pdfs/
├── wiki/                        ← Layer 2: LLM 소유 구조화 지식
│   ├── sources/
│   ├── concepts/
│   ├── entities/
│   ├── insights/
│   ├── projects/
│   ├── index.md                 ← Layer 3: 전체 카탈로그
│   └── log.md                   ← 작업 이력 (필수 추적)
├── system/
│   ├── config/vault.config.yaml ← 도메인·카테고리 설정
│   └── docs/PROGRESS.md         ← 온보딩 체크리스트
└── .claude/
    ├── settings.json            ← Claude Code 하네스 설정
    └── skills/                  ← 작업별 절차 (setup, ingest, query, lint, ...)

필수 파일 역할

파일역할초기 내용
CLAUDE.mdLLM의 세션 프로토콜setup_completed 상태 + 도메인·카테고리 플레이스홀더
vault.config.yaml지식저장소 메타데이터setup_completed: false 상태로 시작
index.md전체 페이지 카탈로그빈 카탈로그 템플릿 (Projects, Insights, Concepts, Entities 섹션)
log.mdAppend-only 작업 이력”# 작업 이력\n\n> Append-only 작업 기록…” 헤더만

온보딩 5단계 (처음 설정 순서)

Step 1/setup 실행 (5분)

목표: 자신의 도메인·관심 주제 정의

사용자 입력:
  - 지식저장소 이름: "내 두뇌"
  - 도메인: "AI 기술 학습 + 블로그 운영"
  - 관심 주제 5개: AI기술, 글쓰기, 커리어, 독서, 일상

결과:

  • vault.config.yaml 자동 생성
  • CLAUDE.md 기본 규칙 자동 작성
  • sources.yaml (추후 /curate 용) 템플릿 생성

Step 2 — 첫 소스 인제스트 (10분)

목표: 지식 추가 프로세스 체험

세 가지 방법 중 선택:

  • Mode A (추천 - 시작용): 자주 보는 블로그 URL 1개 입력
    /ingest → "https://simonwillison.net" 입력
    → 여러 포스트 자동 수집 + `wiki/sources/` 요약 생성
    
  • Mode B (로컬파일): 자신이 저장한 PDF/마크다운 1개
  • Mode C (자연어 검색): “AI 에이전트 기술 글” 검색 → 후보 선택

결과: wiki/sources/ 에 첫 3~5개 요약 파일 생성

Step 3/query 첫 질의 (10분)

목표: 위키로부터 답변받기

질문 예시:

"Step 2에서 추가한 소스들에서 공통되는 핵심 아이디어는 뭐야?"

결과:

  • LLM이 소스들을 읽고 통합 요약 생성
  • wiki/insights/ 에 첫 인사이트 파일 자동 저장
  • log.md에 자동 기록

Step 4/lint 첫 건강 체크 (5분)

목표: 위키 데이터 품질 확인

/lint 실행 → 6가지 체크 항목 자동 실행:
  ✓ Critical issues (0개) → 무시해도 됨
  ✓ Dangling links (0개) → 깨진 링크 없음
  ✓ Stale content (0개) → 오래된 것 없음
  ✓ Frontmatter 완성도 → 첫 파일들의 메타데이터 확인
  ✓ Contradiction 섹션 → 모순 없음
  ✓ valid_as_of 6개월 기준 → 처음엔 무관

Step 5/curate RSS 설정 (선택, 5~10분)

목표: 자동으로 관심 분야 소식 수집

/curate 실행 → sources.yaml에 RSS 피드 추가:
  - r/MachineLearning (Reddit)
  - arXiv cs.AI (학술지)
  - 관심 블로거 RSS 피드

매주 자동으로 신규 소식 발굴 → /ingest 후보로 제시

총 소요 시간: 35~50분


도메인별 커스터마이징 가이드

사례 1️⃣: AI 기술 학습자 (교육자 관점)

Step 1 설정 예시:

vault:
  name: "AI 학습 저장소"
  domain: "Agentic AI, LLM, 생성형AI 기술 학습"
  topics:
    - id: agentic_ai
      name: "에이전트 아키텍처"
      keywords: [에이전트, Tool Use, Multi-Agent, Reflection]
    - id: llm_basics
      name: "LLM 기초"
      keywords: [프롬프트, 토크나이저, 임베딩]
    - id: teaching
      name: "교육 방법론"
      keywords: [강의설계, 실습, 평가]

Step 2 소스 추천:

  • Simon Willison의 블로그 (agentic-ai, llm-basics)
  • Karpathy의 유튜브 강의 (llm-basics)
  • HuggingFace 공식 블로그 (llm-basics)
  • 자신의 강의 자료 PDF (teaching)

첫 달 목표:

  • 20~30개 sources 수집
  • 3~5개 concepts 문서 작성 (개념 정의)
  • 2~3개 insights 문서 작성 (3개 이상 소스 통합)

사례 2️⃣: DAP 운영 엔지니어 (실무자 관점)

Step 1 설정 예시:

vault:
  name: "DAP 운영 나노지식베이스"
  domain: "Airflow, Redshift, DataStage 실무 노하우"
  topics:
    - id: dap_ops
      name: "DAP 운영"
      keywords: [Airflow DAG, Redshift, 멱등성]
    - id: incident_response
      name: "장애 대응"
      keywords: [RCA, Runbook, 자동화]

Step 2 소스 추천:

  • 회사 내부 Runbook (자신이 작성한 것)
  • Astronomer 공식 DAG 모범 사례
  • 자신의 장애 대응 기록 (PM 노트)

첫 달 목표:

  • 10~15개 sources (실제 장애 케이스)
  • 3~5개 concepts (DAG 설계 패턴, 멱등성 등)
  • 1~2개 insights (장애 분석 종합)
  • 1~2개 projects (현재 진행 중인 개선 항목)

사례 3️⃣: 일반 지식 관리 (개인용)

Step 1 설정 예시:

vault:
  name: "개인 두뇌"
  domain: "자기계발, 일상, 일 노하우"
  topics:
    - id: career
      name: "커리어"
      keywords: [기술, 리더십, 면접]
    - id: life
      name: "일상"
      keywords: [운동, 독서, 여행]

Step 2 소스 추천:

  • 자주 읽는 뉴스레터 (Substack)
  • 개인 블로그 아카이브
  • 책 요약 노트

첫 달 목표:

  • 15~25개 sources
  • 2~3개 concepts
  • 1개 insights (자신의 일주일 배움 종합)

핵심 운영 규칙 (반드시 기억할 5가지)

1️⃣ raw/ 폴더는 건드리지 말 것

❌ raw/ 파일 수정 절대 금지 → 원본 무결성 보존
✅ raw/ 파일 추가는 O (새로운 원본 인제스트)

2️⃣ log.md를 먼저 쓰고 wiki/ 편집

모든 wiki/ 수정 전:
  1. log.md 열기
  2. "## [2026-04-27] ingest | 새 소스 추가" 엔트리 추가
  3. 그 다음 wiki/ 파일 편집

3️⃣ 3개 이상 소스를 합치면 insights/로

✅ 소스 1개 → wiki/sources/[소스].md (요약만)
✅ 소스 2개 → wiki/concepts/[개념].md (개념 정의)
✅ 소스 3개+ → wiki/insights/[주제]-[날짜].md (통합 분석)

4️⃣ Frontmatter 6개 필드 필수

tags: [array]
created: YYYY-MM-DD
updated: YYYY-MM-DD
valid_as_of: YYYY-MM-DD     # 수치/통계/정책 정보는 필수
sources: [링크 배열]
source_count: N

5️⃣ valid_as_of가 6개월 이상 경과하면 lint 플래그

2026-04-27 파일 생성
  ↓ (6개월 경과)
2026-10-27 이후 /lint 실행
  → ⚠️ "valid_as_of 만료" 플래그 표시
  → 파일 내용 검수 후 업데이트

🔨 온보딩 체크리스트

초기 설정 (첫 30분)

  • /setup 실행 → 도메인·카테고리 정의
  • vault.config.yaml 생성 확인 → setup_completed: false 상태
  • raw/ 3개 폴더 생성 (articles, youtube, pdfs)
  • wiki/ 6개 폴더 생성 (sources, concepts, entities, insights, projects, views)
  • system/config/, system/docs/ 폴더 생성
  • .claude/skills/ 폴더 구조 확인 (선택 - 기존 skills 복사 가능)

첫 주 운영 (매일 5~10분)

  • Day 1: 첫 소스 3~5개 인제스트 (/ingest)
  • Day 2~3: /query 첫 질의 → 인사이트 생성
  • Day 4: /lint 첫 건강 체크
  • Day 5: 개념 페이지 1개 작성 (여러 소스의 공통점)
  • Day 7: /curate RSS 설정 또는 주간 루틴 계획

첫 달 이후 (주 1~2회)

  • 매주 금요일: /lint 건강 체크 (5분)
  • 매주: log.md 최근 항목 3~5개 확인 (진도 파악)
  • 월 2회: 새 소스 5~10개 인제스트

📚 참고 개념


🎓 추천 학습 순서

처음 1주일: Step 13 완료 (온보딩 끝) 1~4주차: Step 45 + 도메인별 첫 sources 20개 수집 1개월 후: 자신의 concepts 파일 2~3개 직접 작성 → insights 첫 시도

3개월 후 목표:

sources:     30~50개 (도메인 핵심 자료)
concepts:    5~10개 (개념 정의 문서)
insights:    3~5개 (통합 분석)
projects:    1~2개 (현재 진행 중인 일/학습)
progress:    ⭐⭐⭐⭐ (자신의 지식이 눈에 보임)

시작하기: 지금 바로 /setup 명령어를 실행하세요! 🚀