테스트 데이터 고민됨 요즘
본문
프로젝트 하면서 제일 빡센 게 테스트용 데이터 어떻게 관리하냐 이거임. 그냥 더미 데이터 몇 개 넣어놓으면 기능은 도는 것 같아도, 실제 케이스랑은 너무 다르니까 버그가 숨어있다가 나중에 터지더라. 근데 진짜 프로덕션 데이터 복사해서 쓰자니 보안 이슈 때문에 절대 못 쓰고, 적당히 가짜 데이터 만들어 쓰자니 현실성이 부족하고. 내가 요즘 고민하는 건, 지라나 컨플루언스 같은 툴처럼 데이터를 샘플링해서 패턴만 살리고 PII 같은 민감정보는 싹 치환해버리는 방식. 예를 들면 이름은 전부 랜덤 한국어 이름으로 바꾸고, 전화번호나 주민번호는 규칙만 남긴 채 다른 숫자로 대체하는 식. 이런 식이면 법적 문제도 덜하고, 실제 환경이랑 유사성도 유지할 수 있지 않을까 싶음. 다만 직접 변환 로직 짜는 게 은근 시간 잡아먹음. 혹시 팀에서 테스트 데이터 어떻게 관리하고 있는지 공유 좀 해주라. 완전 가짜 데이터만 쓰는지, 아니면 변환해서 쓰는지, 자동화 툴 같은 거라도 있으면 추천해주면 ㄹㅇ 고마움....
좋아요8
이 글을 좋아요하셨습니다
익명73님의 댓글
익명73메일보내기 이름으로 검색 아이피 (112.♡.155.141) 작성일테스트 데이터 고민 진짜 공감됨, 우리도 프로덕션 패턴만 남기고 민감정보는 마스킹해서 쓰고 있음. 직접 짜면 시간 많이 깨지니까 Faker 같은 라이브러리랑 조합해서 자동화 스크립트로 돌리면 유지보수 훨씬 편해져.