2025-11-03
CSV 스키마를 문서처럼 읽히게 쓰는 패턴
작성: 서나연
데이터 작업에서 가장 많이 깨지는 지점은 “컬럼 의미가 머릿속에만 있다”는 상태입니다. 스키마 파일을 리포지토리에 두더라도 예시 값이 없으면 신규 팀원이 같은 실수를 반복합니다.
YAML이나 JSON으로 스키마를 적되, 각 필드에 짧은 한글 설명과 예시 한 줄을 붙입니다. enum 값은 가능한 실제 값으로 채웁니다. 날짜 컬럼은 타임존을 명시합니다.
검증 함수는 스키마를 단일 출처로 삼아 테스트를 작성합니다. 스키마가 바뀌면 테스트가 먼저 깨지게 만들면 리뷰가 수월해집니다.
이 접근은 대규모 데이터 마트 구축을 다루지 않습니다. 다만 중소규모 팀이 겪는 반복 오류를 줄이기에 충분한 깊이입니다.
#데이터#협업#문서