정의
**OG-RAG (Ontology-Grounded Retrieval-Augmented Generation)**는 RAG 시스템에 온톨로지(엄격한 논리 규칙)를 결합하여 논리적 오류 없는 답변을 생성하는 기법이다. LLM의 통계적 지식과 온톨로지의 논리적 제약을 동시에 활용.
핵심 아이디어
RAG의 한계:
├─ Knowledge Graph: 완전하지 않음 (빠진 정보 많음)
└─ LLM: 논리가 없음 (통계만 봄)
OG-RAG의 해결책:
├─ KG: 불완전하지만 구조화됨
├─ LLM: 방대하지만 비논리적
└─ 온톨로지: 논리 규칙으로 LLM 제약
결과:
└─ 논리적 오류 없는 생성 (Constraint-aware generation)
문제 사례: 아이언맨의 친구
질문: "아이언맨의 친구는?"
LLM만 사용:
├─ ✅ 캡틴 아메리카 (관련 영화 많음)
├─ ✅ 헐크 (팀 멤버)
├─ ✅ 블랙 위도우 (팀 멤버)
└─ ❌ 타노스 (영화에서 자주 상호작용)
왜?
├─ 통계: (아이언맨, 타노스) 빈도 높음
└─ LLM: "자주 나옴 = 친함" 착각
규칙 추가 후:
├─ 규칙: "If X is enemy of Y, then X ≠ friend of Y"
├─ 재평가: 타노스는 적이므로 제외
└─ ✅ 정답만 반환
4-Step OG-RAG Pipeline
| 단계 | 역할 | 입력 | 출력 |
|---|---|---|---|
| 1. Rule Extraction | 지식 그래프에서 논리 규칙 추출 | KG | 논리 규칙 집합 |
| 2. NL Conversion | 딱딱한 규칙을 자연어로 변환 | 규칙 | 자연어 제약 |
| 3. Context Understanding | 데이터 구조 전체 파악 | KG 전체 | 맥락 정보 |
| 4. Constraint-Aware Gen | 프롬프트에 규칙 포함하여 생성 | Q + Rules + Context | 논리적 답변 |
성능 개선
측정값: 지식 그래프 완성 정확도
기존 방법: 15.8%
OG-RAG: 20.1% (4.3%p 향상!)
Ablation Test (각 요소의 중요도):
├─ 규칙 추가 시: +4.3% ⭐ 가장 중요!
├─ 맥락 이해 시: +1.2%
└─ 자연어 변환 시: +0.8%
세 가지 규칙 유형
분류 규칙 (Classification Rules)
예시:
├─ "If married(X, Y) ∧ person(Y), then person(X)"
│ (배우자가 사람이면 본인도 사람)
└─ "If father(X, Y), then parent(X, Y)"
관계 규칙 (Relationship Rules)
예시:
├─ "If father(X, Y) ∧ spouse(X, Z), then mother(Z, Y)"
│ (아버지의 배우자는 어머니)
└─ "If friend(X, Y) ∧ friend(Y, Z), then possibly_friend(X, Z)"
(친구의 친구는 친구일 가능성)
제약 규칙 (Constraint Rules)
예시:
├─ "¬(enemy(X, Y) ∧ friend(X, Y))"
│ (적이면서 친구 불가)
├─ "¬(father(X, Y) ∧ father(X, Z) ∧ Y ≠ Z ∧ ...)"
│ (한 사람이 다른 두 아이의 아버지일 수 없음)
└─ "If deceased(X), then ¬currently_employed(X)"
응용 분야
- 금융: 기업 신용도, 위험도 평가 (규제 규칙 준수)
- 의료: 진단, 약물 상호작용 금기 (의료 규칙 적용)
- 법률: 판례 분석, 일관된 판결 (법적 논리 유지)
- 과학: 실험 결과 해석 (논리적 일관성 검증)
관련 개념
- RAG — 부모 기술
- Knowledge Graph — 정보 소스
- Ontology — 논리 규칙 표현
- Logical Reasoning — 추론 방식
- Neuro-Symbolic Integration — 신경망과 기호의 결합
- Constraint Satisfaction — 제약 조건 만족
핵심: OG-RAG는 “통계 지능에 논리를 입혀주는” 기술이다. 신뢰 가능한 AI로의 첫 발걸음.