확률 및 통계

시각화, 도수분포표, 히스토그램, boxplot

with_AI 2022. 5. 16. 17:19

시각화

 

도수분포표

  • 데이터가 가지는 값들을 구간으로 나누고 각 구간에 데이터가 포함되는지 세는 방법
  • 분할된 구간과 데이터의 개수를 표로 정리한 것
  • numpy.histogram을 활용하여 쉽게 계산 활용 가능

분포를 쉽게 확인 가능

 

히스토그램

  • 도수분포표를 막대그래프로 나타낸 것
  • 시각적으로 파악 가능
  • matplotlib를 활용하여 표현

 

boxplot

  • 데이터의 산포도를 표현 하는 그림
  • 분포와 이상값을 시각적으로 파악
  • 박스 바깥 가로선들은 이상값을 분리
  • 경계 밖 데이터는 이상값이다.

 

'확률 및 통계' 카테고리의 다른 글

이항분포  (0) 2022.05.16
베르누이 분포  (0) 2022.05.16
정규화, 표준화, 편찻값  (0) 2022.05.16
산포도, 분산, 표준편차, 사분위  (0) 2022.05.10
대표값, 평균값, 중앙값, 최빈값  (0) 2022.05.10