ALL NIGHT STUDY

Chi-squared-test

with_AI 2021. 9. 16. 02:38

Chi-Squared test

One-sample Chi-Squared test

카이제곱 검정은 카이제곱 분포에 관한 검정으로, 관찰된 빈도가 기대되는 빈도와 의미있게 다른지의 여부를 검정하기 위해 사용되는 검정방법이다. 자료가 빈도로 주어졌을 때, 특히 명목척도 자료의 분석에 이용한다.

귀무가설: 분포가 비슷하다.

대안 가설: 분포가 비슷하지 않다.

카이제곱을 구하는 방법은 (관찰값 - 평균값)^2 / 평균값 을 모든 관측값에 대해서 더하면 구할 수 있다.

하지만 카이제곱은 데이터마다 다르게 나오므로 chi-square 분포값을 → p-value로 바꾸는 과정이 필요하다. (표준화 된 값을 얻기 위해)

이때 scipy의 stats.chi2.pdf( ) 함수를 이용해서 구할 수 있다.

Two sample chi-sqaured test

귀무가설: 변수는 각각 독립적이다.

대안가설: 변수는 각각 독립적이지 않다.

 

 

다음 표에서 two sample chi test 를 진행하게 되면,

자유도는 (2-1)(2-1) 이므로 1이다.

이떄 chi-square-test to p-value 값으로 나타내면,

The P-Value is .971238. The result is not significant at p < .05.

대안가설을 기각하지 못하므로 대안가설을 채택한다 → 두 변수들은 각각 독립적이다.

자유도 (Degrees of Freedom) = DoF

  • 해당 parameter를 결정짓기 위한 독립적으로 정해질 수 있는 값의 수.

자유도 구하는 공식: (n-1)

행의 갯수가 늘어난다면 (n-1)(n-1)....

chi - square test의 검증 과정

1) 귀무가설 : 두 변수간 연관이 없다.

2) 대립가설 : 두 변수간 연관이 있다.

3) 신뢰구간 : 95%

'ALL NIGHT STUDY' 카테고리의 다른 글

조건부 확률  (0) 2021.09.16
ANOVA  (0) 2021.09.16
Estimation/Sampling  (0) 2021.09.16
T-test  (0) 2021.09.16
가설 검정  (0) 2021.09.16