안드레이 카파시도 주목할! LLM Wiki 활용법 (Local LLM 활용 공개)
채널: 배움의 달인 (AI·자동화) | 2026-05-06 | 22분
요약
9,700개 Obsidian 노트 중 1,228개를 로컬 LLM으로 인덱싱해 만든 개인 LLM 위키 “알다(Alda)“의 구축 사례와 활용법 공개. 인덱싱·질문·리포트 생성까지 전 과정을 로컬 LLM(MLX)으로 운영하며, Claude Code/Codex의 MCP로 연결해 대규모 리포트 생성에 활용한다. 단순 구축이 아니라 어떻게 쓸 것인가에 방점을 둔 실전 워크플로우.
IDEAS
- LLM Wiki의 핵심 가치는 구축이 아니라 활용 방식을 설계하는 것
- 노트의 원본 퀄리티(인사이트 밀도)가 LLM Wiki 성능을 결정한다
- 로컬 LLM으로 전 과정을 운영하면 민감 정보를 클라우드 유출 없이 처리 가능
- 질문 대화 결과를 자동 저장 → 재인덱싱 → 위키 팩트 자동 업데이트 피드백 루프
- 웹서치 기능으로 2년 전 노트의 stale 정보를 실시간 검증·보완
- Obsidian 플러그인(“알다”)을 직접 제작해 RAG + 그래프 뷰 통합
- MLX 기반 로컬 LLM: 올라마보다 속도 우수, 전력·발열 고려해 새벽 인덱싱 스케줄
- BGE-M3 임베딩 + NVIDIA NeMo Nemotron + QM 추론 모델 3종 조합으로 71GB RAM 소요
- 로컬 LLM의 컨텍스트 창은 Claude 100만 토큰의 약 1/100 수준 — 복잡한 작업엔 한계
- 복잡한 리포트 생성은 Claude Code/Codex + MCP 연동으로 보완
- CLAUDE.md에 긴 프로세스를 넣으면 토큰 낭비 → 스킬(Skill)로 분리하는 것이 효율적
- 슬래시 커맨드가 아닌 스킬로 작업 흐름을 정의해야 컨텍스트 오염 방지
- 개인 정보(학생 상담 기록 등)는 인덱싱 폴더에서 격리 — 비공개 폴더 운영
- 자동 인덱싱 스케줄(새벽 1시 시작, 5시 종료)로 주간 활동과 충돌 방지
- 알다 대화 폴더가 인덱싱 대상에 포함되어 대화 자체가 위키 소스로 누적
- 전체 볼트가 아닌 선별된 폴더만 인덱싱 → 노이즈 감소, 정밀도 향상
- LLM Wiki는 개인화된 해석이 핵심 — 단일 정답 없음
- AI 리포트 생성 스킬: 웹서치 + RAG + Obsidian 소스 + 개념 지도 자동 생성
- 엔티티(사람·조직)와 컨셉을 구분해 그래프로 관리하면 위키피디아식 탐색 가능
- 로컬 LLM 사양 요건: 128GB 통합 메모리 Mac, 71GB RAM 소요
INSIGHTS
- 피드백 루프가 LLM Wiki를 살아있는 시스템으로 만든다. 질문 → 대화 저장 → 재인덱싱 → 팩트 업데이트가 자동화되면, 위키는 사용할수록 더 정확해지는 복리 구조를 가진다.
- 로컬 LLM과 클라우드 LLM은 경쟁이 아니라 역할 분담이다. 로컬은 프라이버시·비용·상시 인덱싱에, 클라우드(Claude Code)는 긴 컨텍스트·고품질 추론 작업에 최적화해 보완적으로 쓰는 것이 실용적 전략이다.
- LLM Wiki의 ROI는 입력 노트 품질에 비례한다. 구축 기술보다 어떤 인사이트를 기록해왔는가가 결과 품질의 천장을 결정한다.
- 워크플로우의 복잡도는 스킬로 흡수해야 한다. 슬래시 커맨드(CLAUDE.md)에 절차를 넣으면 토큰 낭비와 컨텍스트 오염이 발생하므로, 재사용 로직은 반드시 스킬 파일로 분리해야 한다.
- 개인 LLM Wiki의 진정한 가치는 자신의 사고방식이 반영된 질의응답 시스템이다. 단순 문서 검색이 아니라, 본인이 큐레이션한 지식 위에서 작동하는 개인화 AI라는 점이 차별점이다.
QUOTES
- “LLM 위키를 구축한다라는 그 자체 행위보다 어, 어떠한 노트, 어, 얼만큼 좋은 고퀄리티의 노트, 인사이트가 담긴 노트를 바탕으로 해서 LLM 위키를 구축했냐라는게 더 중요한 핵심인 거 같아요.”
- “슬래시 커맨드로 만들게 되면 이게 다 클로드 md 파일로 들어가게 돼서 그 토큰값을 엄청 잡아먹게 돼요. 그래서 각 과정 한해싱 한 것들을 스킬로 만드는 것을 전 추천을 드립니다.”
- “인덱싱 모든 과정들이 로컬 LLM으로 되고 있다. 제 LLM키에 사용되는 모든 것은 클라우드로 유출되지 않고 오롯이 제 맥북 안에서만 운영이 된다.”
- “단순히 LLM 위키 구축 그 자체만을 생각하는 게 아니라 구축해서 어떻게 사용할 것인가에 대한 저 나름의 해석이 들어가 있는 부분입니다.”
- “로컬 LLM 같은 경우에는 약 토큰값이 컨텍스트 토큰값이 지금 클로드 같은 경우에는 100만 토큰인데 그거에 한 1/100 수준밖에 안 되기 때문에 텍스트의 양이 충분하지 않고 조금 아쉬운 부분들이 있어요.”
REFERENCES
- 인물: Andrej-Karpathy (LLM Wiki 개념 제시자)
- 도구: Obsidian, MLX, Ollama, Claude-Code, Codex
- 모델: QwQ (추론), NVIDIA NeMo Nemotron (분류), BGE-M3 (임베딩)
- 개념: RAG, MCP, LLM-Wiki, Zettelkasten, PKM
FACTS
- 채널 운영자 Obsidian 노트 총 9,700개, 그중 1,228개 인덱싱
- 로컬 LLM 3종 동시 운영 시 약 71GB RAM 소요 (128GB 통합 메모리 Mac 사용)
- Claude의 컨텍스트 창: 100만 토큰 / 로컬 LLM은 약 1만 토큰 (약 1/100)
- 알다 플러그인 통계: 엔티티 908개, 컨셉 429개, 커넥션 10,000+건
- 인덱싱 스케줄: 새벽 1시 로컬 LLM 자동 시작 → 새벽 5시 종료
- 영상 공개일: 2026-05-06
HABITS
- 낮에 생성된 노트를 새벽 2시 자동 인덱싱 배치로 처리 → 아침에 결과 확인
- 질문 대화를 자동 저장 폴더에 보관해 위키 소스로 재활용
- 개인 정보(학생 상담)는 인덱싱 폴더에서 제외, 별도 비공개 폴더로 격리
- 복잡한 작업은 로컬 LLM이 아닌 Claude Code + MCP로 위임
RECOMMENDATIONS
- LLM Wiki 구축 전에 노트 품질을 먼저 점검할 것 — 인사이트가 없는 노트는 좋은 RAG 결과를 내지 못한다
- 긴 작업 절차는 CLAUDE.md 슬래시 커맨드 대신 Skills 파일로 분리해 토큰 절약
- 전체 볼트 인덱싱보다 핵심 폴더만 선별 인덱싱으로 노이즈를 줄일 것
- 로컬 LLM 도입 시 RAM 여유분(71GB 이상)과 발열 스케줄 관리를 함께 계획할 것
- 민감 정보가 있는 경우 로컬 LLM을 통해 클라우드 유출 없이 운영 가능
transcript: 00-Inbox/youtube/YCirjfAurng.ko.vtt