- 주어진 상황에 대해서, 하고자 하는 주장이 맞는지 아닌지를 판정하는 과정.
- 모집단의 실제 값에 대한 sample의 통계치를 사용해서 통계적으로 유의한지 아닌지 여부를 판정함
- 증명된 바가 없는 주장이나 가설을 표본 통계량에 입각하여, 주장이나 가설 진위 여부를
판단, 증명, 검정하는 통계적 추론 방식이다.
귀무 가설
- 직접 검정 가설이 되는 가설, 표본을 관찰하고 이 자료들이 이럴 거라고 세운 가설이다.
- 일단 귀무 가설이 옳다고 시작
- 귀무 가설은 기각이 목표(reject)
대안 가설
- 귀무 가설의 대안이 되는 가설, 귀무 가설이 기각이 되면 받아 들여지는 가설임
- 대안 가설은 채택이 목표다
유의 수준
- 귀무 가설이 실제로 옳은데도, 기각할 오류
- 귀무 가설을 기각할 때 따르는 위험
귀무 가설이 기각인지 채택인지 판단하는 임계값을 유의 수준이라고 부른다.
이 때 귀무 가설을 기각한다는 것은 귀무가설을 지지할 만한 충분한 근거가 부족하다는것이다.
P-Value
- pvalue < 0.01 : 귀무가설이 옳을 확률이 1%이하 -> 틀렸다 (깐깐한 기준) 2) pvalue < 0.05 (5%) : 귀무가설이 옳을 확률이 5%이하 -> 틀렸다 (일반적인 기준)
- 0.05 ~ pvalue ~ 0.1 사이인 경우: (애매함)
- 실험을 다시한다.
- 데이터를 다시 뽑는다.
- 샘플링을 다시한다
- 기존의 경험 / 인사이트를 바탕으로 가설에 대한 결론을 내린다.
- pvalue > 0.1 (10%) : 귀무가설이 옳을 확률이 10%이상인데 -> 귀무가설이 맞다 ~ 틀리지 않았을것이다
p-value가 (1-Confidence)보다 낮은 경우, 귀무가설을 기각하고 대안 가설을 채택함
신뢰구간 (Confidence)
- 보통 95%~99%로 설정
신뢰도 95%의 의미
= 모수가 신뢰 구간 안에 포함될 확률이 95%
= 귀무가설이 틀렸지만 우연히 성립할 확률이 5%
'ALL NIGHT STUDY' 카테고리의 다른 글
Estimation/Sampling (0) | 2021.09.16 |
---|---|
T-test (0) | 2021.09.16 |
미분 (0) | 2021.09.16 |
Tidy 데이터 (0) | 2021.09.16 |
Concat/Merge (0) | 2021.09.16 |