본문 바로가기

Data/ADsP

[ADsP] 추정과 가설검정

1. 데이터 이해 
1-1. 데이터의 이해 
1-2. 데이터의 가치와 미래 
1-3. 가치 창조를 위한 데이터 사이언스와 전략 인사이트 

2. 데이터 분석 기획 
2-1. 데이터 분석 기획의 이해 
2-2. 분석 마스터 플랜 

3. 데이터 분석 
3-1. R 기초와 데이터 마트 

3-2. 통계분석 

  3-2-1. 통계학 개론

  3-2-2. 기초 통계분석

  3-2-3. 다변량 분석

  3-2-4. 시계열 에측

  3-2-5. 다차원 척도법

  3-2-6. 주성분 분석

3-3. 정형 데이터 마이닝

 

통계학 개론

통계 분석 개요

확률 및 확률분포

추정과 가설검정

모수 검정

 

추정과 가설검정

 

1) 추정과 가설검정

통계적 추론
(1) 추정 (2) 가설검정
점추정 구간추정

 - 모수 : 모집단을 조사하여 얻을 수 있는 통계적인 특성치를 모수(Population Prameter)라고 하며 모집단 분포의 특성을 규정짓는 척도이다. (예: 평균, 분산, 표준편차, 백분위수 등)

일반적으로 모수는 알려져 있지 않은 미지의 상수로써 취급되며 통계적 추론을 통해 모수를 추론할 수 있다.

*통계적 추론 :  모집단에서 추출한 표본 특성을 분석하여, 모수에 대해 추측/추론을 하는 과정

 

- 모집단의 평균(모평균)을 추정하기 위한 추정량으로 표본평균이 대표적

- 모집단의 분산(모분산)을 추정하기 위한 추정량으로 표본분산이 대표적

 

  1. 점추정 : 가장 참값이라고 여겨지는 하나의 모수 값을 선택하는 것. 모수가 특정한 값일 것이라고 추정하는 것.
  2. 구간추정
    • 모수가 특정한 구간에 있을 것이라는 개념으로 신뢰구간을 추정하는 방법
    • 신뢰수준 : 90%, 95%, 99%의 확률을 이용하는 경우가 많다
    • 신뢰수준 95% : 한 개의 모집단에서 동일한 자료의 확률표본을 무한히 추출하여 각 확률표본마다 신뢰구간을 구하면, 무한히 많은 신뢰구간 중 95%의 신뢰구간이 미지의 모수를 포함한다는 의미
    • 모집단의 확률분포를 정규분포라 가정할 때, 95% 신뢰수준 하에서 모평균 μ의 신뢰구간

(A visual representation of the Empirical (68-95-99.7) Rule based on the normal distribution, wikipedia)

 

2. 가설검정

- 모집단에 대한 귀무가설(H0)과 대립가설(H1)을 설정한 뒤, 표본관찰 또는 실험을 통해 하나를 선택하는 과정

- 귀무가설이 옳다는 전제하에 관측된 검정통계량의 값보다 대립가설을 지지하는 값이 나타날 확률을 구하여 가설의 채택여부 결정

* 귀무가설(H0) : 대립가설과 반대의 증거를 찾기 위해 정한 가설

* 대립가설(H1) : 증명하고 싶은 가설

 

3. p-value

- 귀무가설이 옳다는 가정하에 얻은 통계량이 귀무가설을 얼마나 지지하는 지를 나타낸 확률

- p-value의 값이 적을수록 귀무가설을 기각할 가능성이 높아진다

- p-value의 값이 유의 수준( α ) 보다 작으면 귀무가설을 기각한다

 

4. 가설검정의 오류

- 제1종 오류와 제 2종 오류는 상충관계가 있음

- 제1종 오류의 확률을 0.1, 0.05, 0.01 등으로 고정한 뒤, 제2종 오류가 최소가 되도록 기각역을 설정한다

- 기각역 : 귀무가설을 기각하는 통계량의 영역

 

정확한 사실\가설검정 결과 귀무가설(H0)이 사실이라고 판정  귀무가설(H0)이 사실이 아니라고 판정 
귀무가설(H0)이 사실임 옳은 결정 제 1종 오류(α)
귀무가설(H0)이 사실이 아님 제2종 오류(β) 옳은 결정

 

 
반응형

'Data > ADsP' 카테고리의 다른 글

[ADsP] 모수 검정  (0) 2023.10.05
[ADsP] 확률 및 확률분포  (2) 2023.10.05
[ADsP] 통계 분석 개요  (1) 2023.10.05