확률 및 통계
시각화, 도수분포표, 히스토그램, boxplot
with_AI
2022. 5. 16. 17:19
시각화
도수분포표
- 데이터가 가지는 값들을 구간으로 나누고 각 구간에 데이터가 포함되는지 세는 방법
- 분할된 구간과 데이터의 개수를 표로 정리한 것
- numpy.histogram을 활용하여 쉽게 계산 활용 가능
분포를 쉽게 확인 가능
히스토그램
- 도수분포표를 막대그래프로 나타낸 것
- 시각적으로 파악 가능
- matplotlib를 활용하여 표현
boxplot
- 데이터의 산포도를 표현 하는 그림
- 분포와 이상값을 시각적으로 파악
- 박스 바깥 가로선들은 이상값을 분리
- 경계 밖 데이터는 이상값이다.