통계에서 자주 나오고 중요하지만 실제 뜻을 잘 모르고 쓰는 경우가 많다. 이해했어도 금방 까먹는다...
P-value에 대해 명쾌하게 설명한 자료가 있어 공유한다.
P-value란 두집단(비교대상) 간 실제 평균의 차이가 없는데 차이가 있는 것처럼 보이는 샘플이 추출되었을 확률을 말한다.
두집단을 모두 완전히 파악하려면 두집단 관련 모든 자료를 수집해야한다. 하지만 현실적으로 모든 자료를 파악하기는 힘드므로 샘플을 수집해서 두집단을 파악하려고 한다. 샘플을 수집해서 비교해보니까 두집단은 평균이 달랐다. 그래서 두집단은 평균이 다르다라고 판단을 했지만, 모든 자료를 수집해서 비교해본 결과 두집단은 평균이 같은 집단이었다. 이런 확률을 P-value라고 한다.
보통 0.05 P-value를 기준으로 이보다 적으면 차이가 있다고 판단한다(대립가설 채택).
댓글 영역