데이터 전처리란? 머신러닝 프로젝트에 사용하기 위해, 데이터를 모델이 이해할 수 있는 형태로 변환하거나 품질을 올리는 일련의 과정 DS 전문가가 가장 많이 시간을 쓰는 일은 데이터 전처리 과정이다. 모든 데이터 분석 프로젝트에서 데이터 전처리는 반드시 거쳐야 하는 과정이다. 대부분의 데이터 분석가가 좋아하지 않는 과정이지만, 분석 결과/인사이트와 모델 성능에 직접적인 영향을 미치는 과정이기 때문에 중요하게 다루어지는 과정이다. 데이터 전처리를 해야 하는 이유? Garbage In Garbage Out 쓰레기를 넣으면 쓰레기 결과가 나오기 떄문이다. 정제되지 않은 데이터를 dirty data라 하고, dirty data를 정제하는 것을 cleaning 또는 scrubbing한다고 한다. 데이터 중 dirt..