Combining Machine Learning and Ontology — A Systematic Literature Review

Summary

머신러닝과 온톨로지의 근본적 결합. 플라톤의 동굴 우화로 시작하는 고전 AI의 핵심 문제: 데이터의 그림자만 보고 현실의 참된 의미를 이해하지 못하는 AI의 한계. 이를 극복하기 위해 두 가지 상보적(complementary) 추론 방식의 통합을 제시. 귀납적 학습(Machine Learning의 데이터로부터 패턴 발견)과 연역적 추론(Ontology의 규칙 기반 논리 적용)이 하나의 “Hybrid Brain”으로 통합될 때, AI는 진정한 이해와 설명 가능성을 갖춘 신뢰할 수 있는 시스템으로 진화한다는 주장.

Key Claims

플라톤의 동굴 문제: AI는 데이터라는 동굴 벽의 그림자만 보고, 현실의 진짜 의미(노믹 필연성, causal reality)를 이해하지 못함
두 가지 추론의 보완성: 머신러닝(귀납적)과 온톨로지(연역적)는 서로 다른 방식으로 강점을 보유
Hybrid Brain의 필요성: 둘을 결합하면 완전한 추론 체계 완성 (학습 능력 + 논리적 일관성)
Learning-Augmented Ontology: 머신러닝으로 자동으로 대규모 온톨로지 구축 가능 (지식 확장 가능성)
Semantic Data Mining: 온톨로지로 머신러닝을 강화 (데이터에 “날개” 달아주기)
자율주행 사례: 카메라 인식(ML) + 교통법칙 지식(Ontology) = 안전한 자동화
의료 진단 사례: 증상 패턴(ML) + 의료 진단 규칙(Ontology) = 설명 가능한 진단
세 가지 미해결 도전: 표현력(knowledge complexity vs system speed), 설명 가능성, 일관성 유지
신뢰성이 최종 목표: 성능 최적화를 넘어 인간과의 신뢰 기반 협력 관계 구축

Key Concepts Created

Platonic-Cave-and-AI — AI의 근본 한계: 그림자만 봄
Inductive-Learning — 머신러닝의 역할: 탐정처럼 패턴 발견
Deductive-Reasoning — 온톨로지의 역할: 판사처럼 규칙 적용
Hybrid-Brain — 두 방식의 완전한 통합
Learning-Augmented-Ontology — ML로 자동 온톨로지 구축
Semantic-Data-Mining — 온톨로지로 ML 강화
AI-Explainability-Trust — 신뢰와 투명성의 중요성

The Core Metaphor: Plato’s Cave

동굴 안의 죄수들이 본 것:
├─ 벽에 비친 그림자
├─ 그것이 전부라고 생각
└─ 현실(현실의 물건)은 모름

현대 AI의 상황:
├─ 데이터라는 "그림자"만 봄 (statistical patterns)
├─ 데이터에서 패턴을 배우지만
└─ 그 의미(semantics)를 모름 → 환각(hallucination) 발생

해결책:
└─ 온톨로지가 "동굴 밖의 세상"을 보는 "빛"

Two Complementary Reasoning Paradigms

1. Inductive Learning (귀납적 학습) — Machine Learning

Role: 탐정(Detective)
├─ 증거(data)로부터 패턴 발견
├─ "이 환자들이 모두 같은 증상을 보였다"
├─ → 새로운 환자도 같은 조건이면 같은 병일 가능성
└─ 강점: 데이터 기반, 자동 학습, 유연함

2. Deductive Reasoning (연역적 추론) — Ontology

Role: 판사(Judge)
├─ 규칙(laws)을 적용하여 판단
├─ "교통법칙: 빨간불 → 정지"
├─ → 모든 상황에서 일관되게 적용
└─ 강점: 논리적 엄격성, 일관성, 설명 가능함

3. The Hybrid Brain (통합)

System = ML + Ontology

자율주행 자동차:
├─ Vision (CNN): 카메라 → 보행자, 신호등 인식 (ML)
├─ Knowledge Engine: 교통법칙, 안전규칙 적용 (Ontology)
└─ Decision: 인식 + 규칙 = 안전한 주행

의료 진단 AI:
├─ Pattern Recognition: 증상 → 가능한 질병들 추출 (ML)
├─ Medical Ontology: 진단 규칙, 약물 상호작용 확인 (Ontology)
└─ Output: 진단 + 설명 근거

Learning-Augmented Ontology (자동 온톨로지 구축)

전통적 온톨로지:
└─ 전문가가 수동으로 설계 → 시간 많이 걸림, 확장 어려움

Learning-Augmented 방식:
├─ 1단계: 큰 코퍼스에서 ML로 패턴 자동 추출
├─ 2단계: 추출된 패턴을 온톨로지 구조로 변환
├─ 3단계: 전문가가 검증 및 미세 조정
└─ 결과: 대규모 고품질 온톨로지 (수작업 1/100)

효과:
└─ 온톨로지의 "데이터 저장소" → "마스터 카탈로그"로 전환

Semantic Data Mining (온톨로지로 ML 강화)

"데이터에 날개를 달아주기"

전통적 ML:
├─ 특성 공학(Feature Engineering): 수동으로 피처 선택
├─ 결과: 도메인 지식 필요, 시간 많음
└─ 문제: 의미적 연관성 놓침

Semantic Data Mining:
├─ 온톨로지의 개념·관계를 피처로 사용
├─ "고객" + "구매 이력" + "선호도" → 자동 그룹화
├─ 결과: ML이 "의미있는" 패턴 학습
└─ 효과: 정확도 ↑, 필요 데이터 ↓

Concrete Examples

자율주행 자동차

상황: 교차로의 빨간 보행 신호

Vision Module (ML):
├─ CNN으로 "사람" 인식 ✅
├─ "빨간색" 감지 ✅
└─ 확률: 92%

Knowledge Engine (Ontology):
├─ 규칙: "보행자 + 빨간 신호 = 정지"
├─ 또는: "최대 속도 × 정지 거리 = 안전 거리"
└─ 판정: "정지해야 함"

Output:
└─ 자동차 정지 (설명 가능: "보행자 적신호, 충돌 위험")

의료 진단 시스템

환자: 기침, 발열, 피로

ML Component:
├─ EHR 데이터로부터 유사 환자 사례 검색
├─ 가능한 질병: [감기 80%, 독감 15%, 폐렴 5%]
└─ 확률적 예측

Ontology Component:
├─ 의료 규칙:
│  ├─ "발열 + 기침 + 피로" → 감기/독감 의심
│  ├─ "기침 지속 > 3주" → 폐결핵 검사 필요
│  └─ 약물 상호작용: "약 A + 약 B" → 피해야 함
├─ 환자의 약물 복용 이력 확인
└─ 금기 약물 필터링

Output:
└─ 진단: "감기 의심 (80% 신뢰도)"
   근거: "증상 + 유사 사례 + 의료 규칙"
   권장 약물: (안전한 조합만)
   설명: "귀납적 학습 + 연역적 규칙의 종합 결정"

Three Remaining Challenges

1. Expressiveness (표현력)

문제:
├─ 지식이 복잡할수록 시스템 속도 ↓
├─ 온톨로지 크기 ↑ → 추론 시간 ↑
└─ 실시간 시스템에서 병목

예시:
├─ 단순 규칙 "A → B": 빠름 ✅
├─ 복합 규칙 "A + B + C + D + E → X": 느림 ❌
└─ 트레이드오프: 표현력 vs 성능

해결 방향:
└─ 하이브리드 추론: 빠른 경로(ML) + 정확한 경로(Ontology) 선택

2. Explainability (설명 가능성)

문제:
├─ ML 모델: "블랙박스" (왜 이 결정? → "모름")
├─ Ontology: 설명 가능 (규칙 기반)
└─ 결합 시: 설명 경로를 어떻게 투명하게 유지?

예시:
├─ "이 고객에게 상품 추천한 이유는?"
├─ ML: "패턴 일치 스코어 87%"
├─ Ontology: "고객 선호도 프로필 매칭"
└─ 통합 설명: ?

해결 방향:
└─ Neuro-Symbolic 설명: 각 컴포넌트의 판단 근거를 명시적으로 추출

3. Consistency (일관성 유지)

문제:
├─ 새로운 데이터 학습 시 온톨로지 변경 필요
├─ "기존 규칙과 새 규칙이 모순?"
├─ ML 업데이트 → 기존 추론 결과와 불일치
└─ 실시간 시스템에서 심각한 문제

예시:
├─ 의료: "약 A는 금기" vs 새로운 ML 모델 "약 A 추천"
├─ 금융: "신용도 계산 규칙" vs "ML 모델 예측" 불일치
└─ 충돌 시 어느 것을 신뢰?

해결 방향:
└─ Consistency Checking: 온톨로지 + ML 결과를 동적으로 검증
   → 모순 발견 시 알림 & 중지

Explainability and Trust: The Ultimate Goal

성능(Performance)을 넘어서:

전통적 평가:
├─ 정확도 99%
├─ 속도 100ms
└─ → "좋은 AI"?

현대적 평가:
├─ 정확도 95% (약간 낮아도)
├─ + 설명 가능성 ✅
├─ + 사용자 신뢰 ✅
├─ + 규제 준수 ✅
└─ → "신뢰할 수 있는 AI" ✅

핵심 변화:
├─ 의료: "정확한 진단" → "환자가 이해하는 설명 기반 진단"
├─ 금융: "높은 ROI" → "규제 투명성 + 감시자 신뢰"
├─ 법률: "판결" → "판결 근거의 명확성"
└─ 전반: 성능과 신뢰의 균형

인간-AI 협력의 미래:
├─ AI는 "의사결정 도구" (도우미, 상담가)
├─ 인간은 "책임 주체" (최종 결정권, 감시)
└─ → 투명한 소통이 필수 전제

Ontology — 지식 표현의 기초
Inductive-Learning — ML의 패턴 발견 역할
Deductive-Reasoning — 논리 기반 추론
Neuro-Symbolic-AI — 신경망과 기호주의의 결합
Vector-Ontology — 벡터 공간에서의 온톨로지 표현
Knowledge-Representation — 지식의 형식화
LLM — 현대 AI 모델
RAG — 온톨로지가 정보 제공
AI-Explainability-Trust — 설명과 신뢰
Hybrid-Brain — 통합 시스템

Impact on Modern AI Systems

적용 분야

의료 진단 및 치료 계획
- 정확성(ML 학습) + 설명성(Ontology 규칙) = 의사-환자 신뢰
자율주행 & 로봇
- 인식(ML) + 안전 규칙(Ontology) = 신뢰할 수 있는 자동화
금융·보험
- 위험 패턴 감지(ML) + 규제 규칙(Ontology) = 감시 가능한 AI
법률 및 정책
- 사례 기반 학습(ML) + 법률 규칙(Ontology) = 설명 가능한 판결

미래 전망

Hybrid Brain 완성 시:
├─ AI가 진정한 "이해"를 갖춤
├─ 성능과 신뢰성의 동시 달성
├─ 인간-AI 진정한 협력
└─ 지속 가능한 AI 생태계 구축

비평적 관점 (미해결 질문)

온톨로지의 “경계”를 어떻게 설정할 것인가? (과도한 단순화 vs 과도한 복잡성)
Hybrid Brain에서 충돌 해결의 원칙은 무엇인가? (ML 우선? Ontology 우선?)
설명 가능성과 성능 사이의 최적점은 존재하는가?
이 방식이 대규모 시스템(수백만 개념)에 실제로 확장 가능한가?

출처: AI인터시스브랜드 채널 (2026-05-04)
영상: “Combining Machine Learning and Ontology — A Systematic Literature Review”
영상 ID: ZHzdVwdLNpk
길이: 약 9:13 (553초)
핵심: 머신러닝과 온톨로지의 상보적 결합을 통한 신뢰 기반 AI의 완성

JYP Garden

탐색기

Combining Machine Learning and Ontology — A Systematic Literature Review

Summary

Key Claims

Key Concepts Created

The Core Metaphor: Plato’s Cave

Two Complementary Reasoning Paradigms

1. Inductive Learning (귀납적 학습) — Machine Learning

2. Deductive Reasoning (연역적 추론) — Ontology

3. The Hybrid Brain (통합)

Learning-Augmented Ontology (자동 온톨로지 구축)

Semantic Data Mining (온톨로지로 ML 강화)

Concrete Examples

자율주행 자동차

의료 진단 시스템

Three Remaining Challenges

1. Expressiveness (표현력)

2. Explainability (설명 가능성)

3. Consistency (일관성 유지)

Explainability and Trust: The Ultimate Goal

Impact on Modern AI Systems

적용 분야

미래 전망

비평적 관점 (미해결 질문)

그래프 뷰

목차

JYP Garden

탐색기

Combining Machine Learning and Ontology — A Systematic Literature Review

Summary

Key Claims

Key Concepts Created

The Core Metaphor: Plato’s Cave

Two Complementary Reasoning Paradigms

1. Inductive Learning (귀납적 학습) — Machine Learning

2. Deductive Reasoning (연역적 추론) — Ontology

3. The Hybrid Brain (통합)

Learning-Augmented Ontology (자동 온톨로지 구축)

Semantic Data Mining (온톨로지로 ML 강화)

Concrete Examples

자율주행 자동차

의료 진단 시스템

Three Remaining Challenges

1. Expressiveness (표현력)

2. Explainability (설명 가능성)

3. Consistency (일관성 유지)

Explainability and Trust: The Ultimate Goal

Related Concepts

Impact on Modern AI Systems

적용 분야

미래 전망

비평적 관점 (미해결 질문)

그래프 뷰

목차