정의
현대 의료에서 병원 기록, 의학 논문, 건강 데이터 등이 서로 다른 포맷으로 흩어져 있어 의미 있는 통합이 어려운 상황. 데이터 자체는 풍부하지만 연결 고리가 없는 ‘정보 혼란’ 상태.
특징
문제의 본질:
- 데이터 양의 문제가 아님
- 서로 다른 언어, 포맷, 분류 체계
- 아무런 연결 고리 없음
비유: 전 세계 도서관 책을 한 곳에 쏟아 부었으나 분류법과 목차 없는 상태
기존 해결 시도
온톨로지 매핑: 손으로 용어 하나하나 매핑
- 시간과 비용 막대
- 규모 확대 불가능
- 수백만 번 반복 필요