Chi-Squared test
One-sample Chi-Squared test
카이제곱 검정은 카이제곱 분포에 관한 검정으로, 관찰된 빈도가 기대되는 빈도와 의미있게 다른지의 여부를 검정하기 위해 사용되는 검정방법이다. 자료가 빈도로 주어졌을 때, 특히 명목척도 자료의 분석에 이용한다.
귀무가설: 분포가 비슷하다.
대안 가설: 분포가 비슷하지 않다.
카이제곱을 구하는 방법은 (관찰값 - 평균값)^2 / 평균값 을 모든 관측값에 대해서 더하면 구할 수 있다.
하지만 카이제곱은 데이터마다 다르게 나오므로 chi-square 분포값을 → p-value로 바꾸는 과정이 필요하다. (표준화 된 값을 얻기 위해)
이때 scipy의 stats.chi2.pdf( ) 함수를 이용해서 구할 수 있다.
Two sample chi-sqaured test
귀무가설: 변수는 각각 독립적이다.
대안가설: 변수는 각각 독립적이지 않다.
다음 표에서 two sample chi test 를 진행하게 되면,
자유도는 (2-1)(2-1) 이므로 1이다.
이떄 chi-square-test to p-value 값으로 나타내면,
The P-Value is .971238. The result is not significant at p < .05.
대안가설을 기각하지 못하므로 대안가설을 채택한다 → 두 변수들은 각각 독립적이다.
자유도 (Degrees of Freedom) = DoF
- 해당 parameter를 결정짓기 위한 독립적으로 정해질 수 있는 값의 수.
자유도 구하는 공식: (n-1)
행의 갯수가 늘어난다면 (n-1)(n-1)....
chi - square test의 검증 과정
1) 귀무가설 : 두 변수간 연관이 없다.
2) 대립가설 : 두 변수간 연관이 있다.
3) 신뢰구간 : 95%
'ALL NIGHT STUDY' 카테고리의 다른 글
조건부 확률 (0) | 2021.09.16 |
---|---|
ANOVA (0) | 2021.09.16 |
Estimation/Sampling (0) | 2021.09.16 |
T-test (0) | 2021.09.16 |
가설 검정 (0) | 2021.09.16 |