정의

**그래프 전파(Graph Propagation)**는 온톨로지 전체를 거대한 연결 네트워크(지하철 노선도처럼)로 보고, 정보가 이 네트워크를 따라 전파되면서 각 개념의 벡터 좌표를 점진적으로 정교화하는 임베딩 방식이다.

핵심 아이디어

온톨로지를 네트워크로 봄:

      ┌─── 사람 ───┐
      │            │
    남성          여성
      │            │
    아버지        어머니
      │            │
      └─── 부모 ───┘

한 개념의 의미:
├─ 주변에 어떤 개념들과 연결되어 있는가
├─ 그 연결들이 얼마나 강한가
└─ 결정됨

정보 전파:
├─ 처음: "사람" 개념의 벡터가 가장 강함
├─ 전파: 사람 → 남성/여성 → 아버지/어머니 → 부모
└─ 결과: 각 개념의 벡터가 주변으로부터 영향받아 정교화

장점

  1. 균형 — 해석 가능성과 유연성의 균형
  2. 문맥 반영 — 전체 구조를 고려한 벡터 계산
  3. 안정성 — 한 개념의 오류가 전체 시스템을 넘어뜨리지 않음
  4. 확장성 — 새로운 개념/관계 추가 시 자동 조정
  5. 신뢰성 — 여러 경로를 통한 검증 가능

제약

  1. 계산 비용 — 네트워크 크기가 크면 매우 무거움
  2. 복잡도 — 구현과 튜닝이 복잡
  3. 중간 선택 — 최고도가 아닌 “충분한” 수준
  4. 수렴 문제 — 정보 전파가 언제 멈출지 결정 필요

실전 예시

지하철 노선도 모델:

역들:
├─ 중앙 역(사람): 가장 교통량 많음
├─ 1호선(남성/여성): 중앙에서 출발
├─ 갈림길(아버지/어머니): 더 세분화됨
└─ 환승역(부모): 여러 노선 교차

정보 흐름:
├─ T=0: "사람"의 벡터 = [1.0, 0.0, ...]
├─ T=1: 인접 역(남/여)에 전파 → [0.6, 0.4, ...]
├─ T=2: 더 멀리(아버지/어머니)에 전파 → [0.4, 0.3, ...]
└─ T=n: 수렴 → 각 개념의 최종 벡터

결과:
└─ 각 개념이 "전체 네트워크에서의 위치"를 반영

적용 분야

  • 소셜 네트워크 — 사용자 간 영향도 분석
  • 생물학 네트워크 — 단백질 상호작용
  • 학술 네트워크 — 논문 간 인용 관계
  • 추천 시스템 — 사용자-상품 관계
  • 하이브리드 시스템 — 해석성과 성능의 균형 필요 시

구현 알고리즘

1단계: 각 개념에 초기 벡터 부여
└─ 온톨로지 구조 기반 (자식이 많으면 강함)

2단계: 반복적 전파
├─ 반복마다 인접 노드로부터 정보 받음
├─ 가중합 계산
└─ 새 벡터값으로 업데이트

3단계: 수렴 체크
├─ 변화가 임계값 이하면 종료
└─ 또는 최대 반복 횟수 도달

4단계: 최종 벡터 사용
└─ 완성된 좌표로 관계 예측

관련 개념


핵심: 그래프 전파는 “균형”을 추구하는 방식이다. 정확성과 유연성, 투명성과 자동성의 중간 지점을 찾으려는 현실적 선택.