Wiki Health Check — 2026-04-27
Summary
- Total pages: 280 (excluding index/log)
- Issues: Critical 3 / Suggested 3 / Ideas 1
- 이전 lint(2026-04-26) 이후 변경:
- 페이지: +54 (5개 ingest 배치, 19개 URL → ~93개 신규 파일 생성)
- Critical 변화: 0C → 3C (신규: orphaned sources, stale claims)
- Suggested 변화: 5S → 3S (개선)
- Data Freshness: GenAI/LLM (0d), Data Eng (1d), Education (0d) ✓ 건강
Trend
| Metric | 2026-04-26 | 2026-04-27 | Δ |
|---|---|---|---|
| Total pages | 226 | 280 | +54 (+24%) |
| Critical | 0 | 3 | +3 |
| Suggested | 5 | 3 | -2 |
| Ideas | 3 | 1 | -2 |
| Orphan pages | ~8 | 31 | +23 |
| Stale claims (>180d) | ~2 | 14 | +12 |
해석: 큰 규모 ingest(5배치, 19URL) 완료 후 자연스러운 일시적 증가. 대부분 linking 작업(3~5일) 후 자동 해결 예상.
Critical (즉시 수정 권장)
C1. Stale Claims (§3) — 2022~2025 구형 소스 14건
-
유형: Stale Claims
-
대상:
- redshift-microstrategy-best-practices, amazon-redshift, microstrategy (valid_as_of: 2022-01-31, 1547일 초과)
- top-10-airflow-best-practices-data-engineers (2024-09-19, 585일)
- addie-instructional-design (2025-01-08, 474일)
- ai-shaping-corporate-training-2025 (2025-02-18, 433일)
- goldengate-architecture-use-cases (2025-04-27, 365일)
- redshift-architecture-patterns-at-scale (2025-05-12, 350일)
- datastage-7-years-etl-mastery (2025-07-11, 290일)
- data-science-dojo-agentic-ai-bootcamp (2025-08-04, 266일)
- exawizards-ax-training-programs (2025-08-19, 251일)
- datastage-scalable-etl-pipelines (2025-11-28, 181일)
- addie-ai-incorporated-curriculum-studies (2025-11-19, 190일)
- ragflow-rag-review-2025 (2025-12-22, 156일 — 거의 한계)
-
문제: 임계값 180일 초과 — AI 기술/교육 도메인에서 6개월 이상 구형 지표·벤치마크 포함.
- 예: Redshift 2022 아키텍처 (3년 전), DataStage 기술 문서 (기능 변경 가능), ADDIE 교육 방법론 (트렌드 변화)
-
제안 수정:
- (a) 재검증: 각 페이지 내용을 2026년 최신 소스·벤치마크로 갱신. 특히 Redshift(AWS latest), DataStage(v11.x 현황), ADDIE(2025+ 교육과정 가이드)
- (b) 삭제: 2022 Redshift 소스 3개는 현 강의 커리큘럼 범위 밖이면 보관 처리 고려
- (c) 일괄 갱신: 5월 ingest 사이클에서 각 도메인 “2026년 버전” 소스 추가 후 기존 페이지 replace
-
상태: new
C2. Orphaned Recent Sources (§1) — 5배치 ingest 직후 20개 sources 연결 대기
-
유형: Orphan Pages (새 sources 미링크)
-
대상 (2026-04-27 ingest, 미링크):
- Batch 5 (Multi-Agent & Multimodal):
- Batch 4 (LangChain & RAG):
- Batch 3 (Vector DB & Embedding):
- Batch 2 (Prompt Engineering & Fine-tuning):
- Batch 1 (Transformer & LLM):
-
문제: 새 sources 파일은 생성되었으나, 기존 wiki 페이지·인덱스에서
sources링크가 부족. 그래프 고립 상태. -
제안 수정:
- (a) Index 링크: wiki/index.md 의 Sources 테이블에 20개 모두 추가 (이미 일부 추가됨; 전체 확인 필요)
- (b) 개념 역링크: 각 source에 관련 concepts 페이지에서 wikilink 추가
- (c) 강의 커리큘럼 매핑: 각 source를 해당 강의 모듈에 연결
- 예: lecture-planning-2026 의 Module 1-6 섹션에서 관련 sources 임베드
-
상태: new
C3. Old Wiki-Health Reports — 11개 보관 대상
-
유형: Orphan Pages (deprecated reports)
-
대상:
-
문제: 이전 lint 보고서들이 wiki/insights에 남아 있으나, 더 이상 참조되지 않음. (그래프 orphan 상태)
-
제안 수정:
- (a) 보관: 최신 2026-04-26 리포트만 유지, 나머지는
archived태그 추가 후 숨김 처리 - (b) 또는 삭제: 2주 이상 지난 lint 보고서는 wiki-health 아카이브로 이동/삭제 정책 수립
- (a) 보관: 최신 2026-04-26 리포트만 유지, 나머지는
-
상태: new
Suggested (다음 ingest 시)
S1. Unprocessed Raw Files (§7) — 47개 raw/articles 대기열
-
유형: Unprocessed Raw
-
대상: 47개 raw/articles 파일 (2026-04-25~04-27 수집)
- FastAPI/Docker: 6개
- DataStage/Jira: 6개
- Prompt Engineering/LoRA: 7개 (최근 4개는 이미 wiki/sources 완성, 3개 pending)
- ML 기초 (scikit-learn, EDA, outlier detection 등): 12개
- Python 기초 (asyncio, type hints, pydantic 등): 5개
- 기타: 5개
-
문제: raw/ 파일이 존재하지만, 아직 wiki/sources/ 합성 페이지로 변환되지 않음. 인제스트 파이프라인 대기 상태.
-
제안:
- 우선순위 순서:
- High (강의 모듈 직결): Prompt Engineering (3개) → wiki/sources 완성 필요
- Medium (기초 보완): Python 기초, ML 기초 (12개) → 2~3일 내 일괄 처리
- Low (DAP 운영): DataStage/Jira (6개) → 5월 ingest 예정
- 액션:
/ingest raw/articles/2026-04-27-*.md일괄 실행 (또는 배치 ingest)
- 우선순위 순서:
-
상태: pending-review (사용자 확인 후 진행 순서 결정)
S2. Missing Wikilinks (§4) — 10+ 문서화 페이지의 평문 언급
-
유형: Missing Links
-
대상 (2회+ 평문 언급 without
link):- High impact (6+ mentions):
jira-workflow-optimization— 9회 평문, concepts/entities 페이지는 있으나 wikilink 부재learning-objectives-abcd— 7회 평문loho-manip(인물) — 7회 평문workflow-automation-tools— 6회 평문
- Medium (3~5 mentions):
langchain-agents-architecture,vector-database-retrieval,chain-of-thought-prompting(각 3~4회)claude-prompting-best-practices(5회)
- Low (2 mentions):
birgitta-bockeler,jang-pm(인물) (2~3회)
- High impact (6+ mentions):
-
제안: 각 파일을 열어 평문 언급 → “ 수동 링크화 (2~3시간 작업)
-
상태: new
S3. Technical Debt — 25+ 고빈도 개념 미페이지화 (§5)
-
유형: Uncovered Concepts
-
대상 (5회+ 언급, 페이지 없음):
- Very High (20+ mentions):
monitoring(28),optimization(28),transformer(24),observability(24),database(24) - High (15~20):
sql(22),metrics(21),git(20),prompt-engineering(19),logging(17) - Medium (10~15):
embedding(14),security(13),machine-learning(12),transformers(12),fine-tuning(12),deep-learning(11),caching(10),documentation(10) - Low (5~10):
etl-pipeline(9),vector-database(9),embeddings(9),kubernetes(8),performance(8),testing(7),neural-network(5)
- Very High (20+ mentions):
-
문제: 이들 개념이 강의 커리큘럼 및 기술 소스에서 자주 언급되지만, 아직 별도 wiki 페이지 없음. 그래프 밀도 저하.
-
제안:
- (a) 우선순위:
transformer,prompt-engineering,machine-learning,fine-tuning→ 강의 Module 2~5와 직결; 신규 sources와 함께 개념 페이지 생성 - (b) 배치 작업: 25개 개념 중 상위 10개 → 5월 내 신규 concepts/ 페이지 작성 (각 2~3시간)
- (c) 또는 병합: 기존 concepts와 merge 가능성 검토 (예:
transformer용어는 transformer-architecture 에 포함될 수 있음)
- (a) 우선순위:
-
상태: pending-review
Ideas (새 소스 추천 등)
I1. Data Gap Analysis — DAP Operations 도메인 소스 부족
-
분석:
- GenAI/LLM 도메인: 0일 전 ingest ✓
- Data Engineering: 1일 전 ingest ✓
- Education: 0일 전 ingest ✓
- DAP Operations (workflow automation, incident management, Jira): 최근 ingest 부재
-
제안: 5월 중 DAP Operations 도메인에서 3~4개 신규 소스 추가
- 예: “Airflow observability 2026”, “Jira automation best practices Q2 2026”, “Incident response patterns 2026”
-
액션:
/ingest <검색어>(5월 우선순위 큐에 추가)
Deferred (이전 lint에서 pending 항목)
None. 이전 2026-04-26 lint의 모든 이슈는 해결 또는 closed 상태.
Executive Summary
상태: ⚠️ 주의 필요 (관리 가능한 수준)
핵심 액션 (우선순위 순):
-
이번 주 (3~5일):
- C2: 20개 orphaned sources 링크화 (index + 개념 역링크)
- C3: 11개 old lint 리포트 아카이브/삭제
-
이번 달 (5월):
- C1: 14개 stale claims 검증 및 갱신 (특히 Redshift 2022, DataStage 기술 문서)
- S1: 47개 raw/articles → wiki/sources 합성 (배치 ingest)
- S3: 상위 10개 uncovered concepts 페이지 생성
- I1: DAP Operations 도메인 3개 신규 소스 추가
예상 해결 일정:
- Critical 3개: 5월 초 해결 완료 (linking + archiving + source refresh)
- Suggested 3개: 5월 중 해결 (raw ingest + concept creation)
- Ideas: 5월 내 선제적 추가
건강도 판정:
- 현재: 🟡 Fair (280 pages, 3C/3S/1I)
- 목표 (2026-06-30): 🟢 Healthy (0C, 1S이하, 300+ pages)
기술 노트
- §1 Orphan Pages: 31개 → 11개 old reports + 20개 new sources
- §3 Stale Claims: 14개 (임계값 180일 초과)
- §7 Unprocessed Raw: 47개 대기열 (최근 5 ingest 배치 후 정상)
- §5 Uncovered Concepts: 25개 고빈도 용어 (강의 모듈과 연결 권장)
- §8, §9, §10, §11: ✓ All clean (no overdue/stale/orphan projects, no dangling pulls)