2024. 1. 11. 17:31ㆍData Science/Study 자료
통계적 가설 검정이란
모집단의 모수에 관하여 두 가지 가설을 세우고 ,표본으로 부터 계산되는 통계량을 이용하여 어느 가설이 옳은지 판단하는 통계적방법
p값을 기준으로 수행하는 가설검정의 흐름
가설을 세운다
▼
유의수준을 결정한다
▼
검정통계량을 계산한다
▼
p값을 계산한다
▼
p값이 유의수준보다 큰가?
▼ ▼
Yes No
귀무가설 채택 귀무가설 기각(대립가설 채택)
가설 세우기
귀무가설
귀무가설은 일종의 '디폴트' 가설로, 특정 효과나 차이가 없다고 가정합니다.
통계적으로 검증하려는 주장이나 가설을 부정하는 명제입니다.
보통 H0로 표기하며, 예를 들어 두 집단 간의 평균 차이가 없다거나 효과가 없다는(동일하다) 등의 주장을 나타낼 수 있습니다.
대립가설
대립가설은 귀무가설을 반증하는 명제로, 어떤 효과나 차이가 존재한다고 주장합니다.
연구자가 입증하려는 가설(뚜렷한 증거)을 나타냅니다.
통계적으로 유의한 결과를 얻을 때, 귀무가설을 기각하고 대립가설을 채택하게 됩니다.
중요한건 어떤 통계방법을 사용하는지? 귀무가설, 대립가설을 어떻게 설정하는지 이게 핵심
유의수준설정
설정한 귀무가설이 맞는지 아닌지 검증을 하기 위해 정하는 파라미터값과 같은 개념입니다.
일반적으로 0.05수준으로 설정하지만 필요에 따라 0.1등으로 조절해 쓰기도 합니다.
가설 검정 수행
유의수준을 바탕으로 가설 검정을 수행합니다.
보통은 집단 간 평균 차이가 유의미한지 확인 하기위해 t-test를 많이 사용합니다.
검정통계량, 의사결정
검정통계량은 귀무가설 Ho가 참인 경우 해당 자료가 우리가 기대하는 것으로부터 얼마나 멀리 벗어나는지를 측정합니다.
유의수준(p-value)를 기반으로 의사결정을 진행하고 일반적으로 유의수준을 0.05로 둔다면 p값이 0.05보다 작을 경우 귀무가설을 기각(대립가설 채택), 높은경우 귀무가설을 채택합니다.
그래프상으로 전체 면적은 1에 해당이 되며 p-value값도 면적 이라고 생각하면되고, t값은 x축의 값 그래서 ±1.96을 기준으로 안쪽에 있을때 귀무가설이 채택이 됩니다.
도움이 될말
자료조사중 기억에 남는 말
비지니스 분석에서 더 중요한건 이 이후의 사이클
대립가설을 채택하게 될 경우, 유의미한 차이가 있었기에 비지니스 인사이트를 발굴했다고 봐고 무방
- 발견한 인사이트를 어떻게 (절차,툴,시점)현업부서에 공유할 것이며
- 공유를 통해 어떠한 액션플랜을 제안할 것이며(몆 가지 가정을 하여 각각의 시나리오에 따른 효과나 유려사항)
- 액션 플랜 의사결정에 따른 회고 분석은 어떻게 수행할 것인지
'Data Science > Study 자료' 카테고리의 다른 글
[통계] 회귀분석 (0) | 2024.01.12 |
---|---|
[통계] 독립표본 t검정, 대응 표본 t검정 (0) | 2024.01.11 |
[pandas]데이터 파악하는 명령어/ 데이터 삭제 (0) | 2024.01.09 |
[시각화] seaborn, matplotlib다중차트 하나의 도화지에 담기 (0) | 2024.01.08 |
[pandas] 데이터 불러오기 (엑셀,csv에 한글 포함) (2) | 2024.01.08 |