정의
**그래프 전파(Graph Propagation)**는 온톨로지 전체를 거대한 연결 네트워크(지하철 노선도처럼)로 보고, 정보가 이 네트워크를 따라 전파되면서 각 개념의 벡터 좌표를 점진적으로 정교화하는 임베딩 방식이다.
핵심 아이디어
온톨로지를 네트워크로 봄:
┌─── 사람 ───┐
│ │
남성 여성
│ │
아버지 어머니
│ │
└─── 부모 ───┘
한 개념의 의미:
├─ 주변에 어떤 개념들과 연결되어 있는가
├─ 그 연결들이 얼마나 강한가
└─ 결정됨
정보 전파:
├─ 처음: "사람" 개념의 벡터가 가장 강함
├─ 전파: 사람 → 남성/여성 → 아버지/어머니 → 부모
└─ 결과: 각 개념의 벡터가 주변으로부터 영향받아 정교화
장점
- 균형 — 해석 가능성과 유연성의 균형
- 문맥 반영 — 전체 구조를 고려한 벡터 계산
- 안정성 — 한 개념의 오류가 전체 시스템을 넘어뜨리지 않음
- 확장성 — 새로운 개념/관계 추가 시 자동 조정
- 신뢰성 — 여러 경로를 통한 검증 가능
제약
- 계산 비용 — 네트워크 크기가 크면 매우 무거움
- 복잡도 — 구현과 튜닝이 복잡
- 중간 선택 — 최고도가 아닌 “충분한” 수준
- 수렴 문제 — 정보 전파가 언제 멈출지 결정 필요
실전 예시
지하철 노선도 모델:
역들:
├─ 중앙 역(사람): 가장 교통량 많음
├─ 1호선(남성/여성): 중앙에서 출발
├─ 갈림길(아버지/어머니): 더 세분화됨
└─ 환승역(부모): 여러 노선 교차
정보 흐름:
├─ T=0: "사람"의 벡터 = [1.0, 0.0, ...]
├─ T=1: 인접 역(남/여)에 전파 → [0.6, 0.4, ...]
├─ T=2: 더 멀리(아버지/어머니)에 전파 → [0.4, 0.3, ...]
└─ T=n: 수렴 → 각 개념의 최종 벡터
결과:
└─ 각 개념이 "전체 네트워크에서의 위치"를 반영
적용 분야
- 소셜 네트워크 — 사용자 간 영향도 분석
- 생물학 네트워크 — 단백질 상호작용
- 학술 네트워크 — 논문 간 인용 관계
- 추천 시스템 — 사용자-상품 관계
- 하이브리드 시스템 — 해석성과 성능의 균형 필요 시
구현 알고리즘
1단계: 각 개념에 초기 벡터 부여
└─ 온톨로지 구조 기반 (자식이 많으면 강함)
2단계: 반복적 전파
├─ 반복마다 인접 노드로부터 정보 받음
├─ 가중합 계산
└─ 새 벡터값으로 업데이트
3단계: 수렴 체크
├─ 변화가 임계값 이하면 종료
└─ 또는 최대 반복 횟수 도달
4단계: 최종 벡터 사용
└─ 완성된 좌표로 관계 예측
관련 개념
- Ontology Embedding — 부모 기술
- Graph Database — 구현 플랫폼
- — 분석 기법
- Geometric Modeling — 해석성 강조 대안
- Sequence Modeling — 유연성 강조 대안
- Knowledge Graph — 응용 대상
핵심: 그래프 전파는 “균형”을 추구하는 방식이다. 정확성과 유연성, 투명성과 자동성의 중간 지점을 찾으려는 현실적 선택.