IBM QualityStage
Summary
IBM InfoSphere QualityStage는 InfoSphere DataStage와 통합되는 데이터 품질 전문 플랫폼으로, 데이터 표준화·중복 제거·주소 검증 등 고급 데이터 정제 기능을 제공한다.
IBM InfoSphere QualityStage는 InfoSphere DataStage와 통합되는 데이터 품질 전문 플랫폼으로, 데이터 표준화·중복 제거·주소 검증 등 고급 데이터 정제 기능을 제공한다.
개요
QualityStage는 ibm-datastage 의 DataStage와 함께 IBM InfoSphere Information Server(IIS) 제품군에 포함된다. DataStage가 범용 ETL을 담당하는 반면, QualityStage는 데이터 품질 처리에 특화된 스테이지를 별도 라이선스로 제공한다.
QualityStage 전용 스테이지는 DataStage Designer의 팔레트에서 Data Quality ¹ 범주로 구분된다. 이 스테이지들은 기본 DataStage 라이선스에 포함되지 않으며, QualityStage 라이선스를 별도로 구매해야 한다.
DAP 환경에서 QualityStage는 고객 데이터·마스터 데이터의 품질 관리(주소 표준화, 중복 고객 식별 등)에 활용될 수 있다.
주요 사실
- 소속 제품군: IBM InfoSphere Information Server (IIS)
- 라이선스: DataStage와 별도 라이선스 — Data Quality ¹ 스테이지 사용을 위해 필수
- 통합 방식: DataStage Designer 내 팔레트의 Data Quality 범주로 통합
- 버전: IIS 11.7 기준 (출처: datastage-qualitystage-alphabetical-list-stages)
QualityStage 전용 스테이지 (Data Quality ¹)
| 스테이지명 | 기능 요약 |
|---|---|
| Investigate | 문자/단어 방법으로 데이터 내용 패턴 분석 |
| Match Frequency | 빈도 분포 보고서 생성 — 데이터 분포 파악 |
| MNS (Multinational Standardization) | 다국가 주소 표준화 처리 |
| One-source Match | 단일 소스 내 중복 레코드 식별 |
| Two-source Match | 두 소스 간 중복 레코드 매칭 |
| Standardize | 데이터 값 표준화 (형식·코드 통일) |
| SQA (Standardization Quality Assessment) | 표준화 처리 품질 평가 |
| Survive | 중복 레코드 그룹 중 대표 생존 레코드 선택 |
관련 개념
- datastage-parallel-job-architecture — DataStage + QualityStage 통합 스테이지 카테고리 체계
관련 엔티티
- ibm-datastage — QualityStage와 통합 운영되는 DataStage ETL 플랫폼