Flowly Castly
메뉴

2025-11-03

CSV 스키마를 문서처럼 읽히게 쓰는 패턴

작성: 서나연

CSV 스키마를 문서처럼 읽히게 쓰는 패턴
데이터 작업에서 가장 많이 깨지는 지점은 “컬럼 의미가 머릿속에만 있다”는 상태입니다. 스키마 파일을 리포지토리에 두더라도 예시 값이 없으면 신규 팀원이 같은 실수를 반복합니다. YAML이나 JSON으로 스키마를 적되, 각 필드에 짧은 한글 설명과 예시 한 줄을 붙입니다. enum 값은 가능한 실제 값으로 채웁니다. 날짜 컬럼은 타임존을 명시합니다. 검증 함수는 스키마를 단일 출처로 삼아 테스트를 작성합니다. 스키마가 바뀌면 테스트가 먼저 깨지게 만들면 리뷰가 수월해집니다. 이 접근은 대규모 데이터 마트 구축을 다루지 않습니다. 다만 중소규모 팀이 겪는 반복 오류를 줄이기에 충분한 깊이입니다.
#데이터#협업#문서