LLM Wiki — 개인 지식관리소의 새로운 패러다임

정의: LLM Wiki는 개인(또는 조직)의 산재된 소스를 한 번 통합하고 구조화된 지식 베이스로 컴파일하여, 이후 쿼리는 이미 누적된 위키를 탐색하는 방식의 지식관리 시스템입니다. RAG와 다르게, 합성은 인제스트 시점에 완료되고 지식이 세션을 넘어 영속화됩니다.


설명

핵심 개념

LLM Wiki는 다음 세 가지 원칙을 기반으로 합니다:

1. 인제스트 시 합성 (Synthesis at Ingest)

  • RAG: 쿼리 → 원본 청크 재검색 → 즉흥 합성 (매번 재계산)
  • LLM Wiki: 소스 추가 → LLM 1회 통합 → 위키에 파일링 → 이후 쿼리는 이미 합성된 위키 탐색

결과: 동일 주제 재쿼리 시 비용 감소, 답변 깊이 증가 (Compounding 효과).

2. 인덱스 우선 탐색 (Index-First Retrieval)

  • 벡터 DB 대신 인간이 읽을 수 있는 카탈로그 (index.md) 사용
  • Grep 기반 전문 검색 + LLM의 컨텍스트 윈도우 활용
  • ~100 소스까지 단순 파일 구조로 충분

결과: 벡터 인프라 불필요, 문맥 풍부, 투명성 높음.

3. 지식의 영속화 (Knowledge Persistence)

  • RAG: 세션 종료 시 모든 합성 결과 폐기
  • LLM Wiki: 위키 파일 자체가 영구적 자산
  • 시간 경과에 따라 지식이 누적, 깊이가 증가

LLM Wiki vs RAG 비교

차원RAGLLM Wiki
합성 시점쿼리 시 즉흥인제스트 시 사전 컴파일
교차참조없음 (청크 단위 고립)풍부한 위키 그래프
모순 처리없음 (충돌 정보 혼재)플래그 + Contradiction 섹션
인프라벡터 DB + 임베딩 모델파일 구조 + Grep
지식 영속성세션 종료 시 폐기위키가 세션을 넘어 유지
비용 (재쿼리)매번 동일감소 (누적된 위키 활용)
소유권LLM이 매번 원본 읽음LLM이 Layer 2(Wiki) 소유·유지

3계층 아키텍처 (Three-Layer Architecture)

LLM Wiki는 세 계층으로 구성됩니다:

Layer 1: Raw Sources (불변 원본)

  • YouTube 영상, 블로그, PDF, 논문
  • 원본 변경 금지 (데이터 무결성)
  • 예: raw/articles/, raw/youtube/, raw/pdfs/

Layer 2: Wiki (구조화된 지식)

  • 소스 요약 + 개념화 + 통합
  • LLM이 유지·갱신
  • 예: wiki/sources/, wiki/concepts/, wiki/insights/

Layer 3: Index & Navigation (탐색 인터페이스)

  • index.md: 전체 카탈로그 (벡터 DB 역할)
  • Grep 기반 검색 + 인간이 읽을 수 있는 정렬
  • Dataview 기반 자동 대시보드

LLM Wiki가 적합한 상황

1. 개인·소규모 도메인 지식

  • ~100 소스 규모
  • 벡터 인프라 없이 운영 가능
  • 예: 개인 학습, 팀 나올리지 베이스

2. 시간 경과에 따른 지식 누적

  • 연구, 교육, 커리어 성장 문맥
  • 소스가 지속 추가되는 환경
  • 예: 강의 자료, 연구 노트, 커리어 포트폴리오

3. 교차참조·맥락 연결이 핵심

  • 분산된 소스 간 아이디어 연결
  • 패턴 인식, 통합 분석
  • 예: 정책 영향도 분석, 기술 비교

4. 모순 감지·일관성 유지

  • 다중 소스 통합 시 충돌 해결 필요
  • Lint 메커니즘으로 데이터 품질 유지
  • 예: 정책·기술 표준화

구현 예: Phase 9 PKM 시스템

phase9-pkm-improvement는 LLM Wiki 원칙을 실현하는 프로젝트입니다:

  • Layer 1 정비: raw/ 파일 명확화 (Inbox SOP)
  • Layer 2 개선: Frontmatter 표준화, Index.md 자동화, Dashboard 구축
  • Layer 3 강화: Dependency Tree, FAQ, Learning Paths

🔨 행동 체크리스트

LLM Wiki 신규 볼트 설정 시 (초기화)

  • 폴더 구조 생성: raw/ (articles, youtube, pdfs), wiki/ (sources, concepts, entities, insights)
  • index.md 초기화: 전체 카탈로그 구조 설계 및 각 섹션 템플릿 작성
  • log.md 생성: “Append-only 작업 이력” 문구 포함 (수정 금지 규칙 명시)
  • /setup 실행: 도메인, 관심 주제(topics) 설정 완료
  • Frontmatter 표준화: 모든 wiki 파일에 동일한 메타데이터 스키마 적용 (tags, created, updated, sources, source_count)
  • 첫 소스 인제스트: 간단한 아티클 1개를 직접 인제스트하여 workflow 검증

주간·월간 LLM Wiki 운영 점검

  • 새 소스 처리: 미처리 inbox 파일 → raw/ → wiki/ 파이프라인 실행
  • log.md 최근 항목 확인: 지난주 작업이 제대로 기록되었는가?
  • index.md 누락 페이지 검사: 신규 생성 파일이 인덱스에 등록되었는가?
  • 모순(Contradiction) 섹션 점검: 소스 간 상충하는 정보가 있는가?
  • Frontmatter 완성도: valid_as_of 날짜가 6개월 이상 경과한 파일이 있는가? (린트 필요)
  • 위키 건강도 린트: 기본 린트 알고리즘 실행 (broken links, stale content 등)

💡 교육자·PM 활용: 학생이나 팀원의 LLM Wiki 설정을 도울 때, 신규 설정 체크리스트를 따르고, 이후 운영 점검 체크리스트로 정기적 유지보수 습관을 들이게 하세요.


구현 사례

  • 알다(Alda)배움의달인-김문정이 직접 개발한 Obsidian 커뮤니티 플러그인. MLX 기반 완전 로컬 운영. 1,228개 노트 인덱싱, 새벽 자동 배치, MCP로 Claude Code 연동.

참고 개념