행(Row)과 열(Column)로 명확하게 조직된 데이터. 스프레드시트, 데이터베이스 테이블, CSV 파일 등의 형태로 각 요소가 정확한 위치와 의미를 가짐.
특징:
- 명확한 스키마 (구조 정의)
- 행과 열의 관계가 명확
- 각 셀의 의미가 정의됨
- 형식이 엄격함
vs 비정형 데이터:
- 정형: 스프레드시트, 데이터베이스
- 비정형: 자유로운 텍스트, 이미지
처리의 어려움:
- LLM에게는 자연스럽지 않은 형식
- 구조 이해가 선행되어야 함
- 관계 파악 필요
응용:
- 데이터 분석
- 정보 검색
- 의사결정 지원
관련: Data-Understanding, Schema-Understanding, Knowledge-Representation