ALL NIGHT STUDY

가설 검정

with_AI 2021. 9. 16. 02:30
  • 주어진 상황에 대해서, 하고자 하는 주장이 맞는지 아닌지를 판정하는 과정.
  • 모집단의 실제 값에 대한 sample의 통계치를 사용해서 통계적으로 유의한지 아닌지 여부를 판정함
  • 증명된 바가 없는 주장이나 가설을 표본 통계량에 입각하여, 주장이나 가설 진위 여부를

판단, 증명, 검정하는 통계적 추론 방식이다.

귀무 가설

  • 직접 검정 가설이 되는 가설, 표본을 관찰하고 이 자료들이 이럴 거라고 세운 가설이다.
  • 일단 귀무 가설이 옳다고 시작
  • 귀무 가설은 기각이 목표(reject)

대안 가설

  • 귀무 가설의 대안이 되는 가설, 귀무 가설이 기각이 되면 받아 들여지는 가설임
  • 대안 가설은 채택이 목표다

유의 수준

  • 귀무 가설이 실제로 옳은데도, 기각할 오류
  • 귀무 가설을 기각할 때 따르는 위험

 

귀무 가설이 기각인지 채택인지 판단하는 임계값을 유의 수준이라고 부른다.

이 때 귀무 가설을 기각한다는 것은 귀무가설을 지지할 만한 충분한 근거가 부족하다는것이다.

P-Value

  • pvalue < 0.01 : 귀무가설이 옳을 확률이 1%이하 -> 틀렸다 (깐깐한 기준) 2) pvalue < 0.05 (5%) : 귀무가설이 옳을 확률이 5%이하 -> 틀렸다 (일반적인 기준)
  • 0.05 ~ pvalue ~ 0.1 사이인 경우: (애매함)
    • 실험을 다시한다.
    • 데이터를 다시 뽑는다.
    • 샘플링을 다시한다
    • 기존의 경험 / 인사이트를 바탕으로 가설에 대한 결론을 내린다.
  • pvalue > 0.1 (10%) : 귀무가설이 옳을 확률이 10%이상인데 -> 귀무가설이 맞다 ~ 틀리지 않았을것이다

p-value가 (1-Confidence)보다 낮은 경우, 귀무가설을 기각하고 대안 가설을 채택함

신뢰구간 (Confidence)

  • 보통 95%~99%로 설정

신뢰도 95%의 의미

= 모수가 신뢰 구간 안에 포함될 확률이 95%

= 귀무가설이 틀렸지만 우연히 성립할 확률이 5%

'ALL NIGHT STUDY' 카테고리의 다른 글

Estimation/Sampling  (0) 2021.09.16
T-test  (0) 2021.09.16
미분  (0) 2021.09.16
Tidy 데이터  (0) 2021.09.16
Concat/Merge  (0) 2021.09.16