IBM QualityStage

Summary

IBM InfoSphere QualityStage는 InfoSphere DataStage와 통합되는 데이터 품질 전문 플랫폼으로, 데이터 표준화·중복 제거·주소 검증 등 고급 데이터 정제 기능을 제공한다.

IBM InfoSphere QualityStage는 InfoSphere DataStage와 통합되는 데이터 품질 전문 플랫폼으로, 데이터 표준화·중복 제거·주소 검증 등 고급 데이터 정제 기능을 제공한다.

개요

QualityStage는 ibm-datastage 의 DataStage와 함께 IBM InfoSphere Information Server(IIS) 제품군에 포함된다. DataStage가 범용 ETL을 담당하는 반면, QualityStage는 데이터 품질 처리에 특화된 스테이지를 별도 라이선스로 제공한다.

QualityStage 전용 스테이지는 DataStage Designer의 팔레트에서 Data Quality ¹ 범주로 구분된다. 이 스테이지들은 기본 DataStage 라이선스에 포함되지 않으며, QualityStage 라이선스를 별도로 구매해야 한다.

DAP 환경에서 QualityStage는 고객 데이터·마스터 데이터의 품질 관리(주소 표준화, 중복 고객 식별 등)에 활용될 수 있다.

주요 사실

  • 소속 제품군: IBM InfoSphere Information Server (IIS)
  • 라이선스: DataStage와 별도 라이선스 — Data Quality ¹ 스테이지 사용을 위해 필수
  • 통합 방식: DataStage Designer 내 팔레트의 Data Quality 범주로 통합
  • 버전: IIS 11.7 기준 (출처: datastage-qualitystage-alphabetical-list-stages)

QualityStage 전용 스테이지 (Data Quality ¹)

스테이지명기능 요약
Investigate문자/단어 방법으로 데이터 내용 패턴 분석
Match Frequency빈도 분포 보고서 생성 — 데이터 분포 파악
MNS (Multinational Standardization)다국가 주소 표준화 처리
One-source Match단일 소스 내 중복 레코드 식별
Two-source Match두 소스 간 중복 레코드 매칭
Standardize데이터 값 표준화 (형식·코드 통일)
SQA (Standardization Quality Assessment)표준화 처리 품질 평가
Survive중복 레코드 그룹 중 대표 생존 레코드 선택

관련 개념

관련 엔티티

  • ibm-datastage — QualityStage와 통합 운영되는 DataStage ETL 플랫폼

소스