1. 데이터 이해
1-1. 데이터의 이해
1-2. 데이터의 가치와 미래
1-3. 가치 창조를 위한 데이터 사이언스와 전략 인사이트
2. 데이터 분석 기획
2-1. 데이터 분석 기획의 이해
2-2. 분석 마스터 플랜
3. 데이터 분석
3-1. R 기초와 데이터 마트
3-2. 통계분석
3-2-1. 통계학 개론
3-2-2. 기초 통계분석
3-2-3. 다변량 분석
3-2-4. 시계열 에측
3-2-5. 다차원 척도법
3-2-6. 주성분 분석
3-3. 정형 데이터 마이닝
통계학 개론
통계 분석 개요
확률 및 확률분포
추정과 가설검정
모수 검정
추정과 가설검정
1) 추정과 가설검정
통계적 추론 | |||
(1) 추정 | (2) 가설검정 | ||
점추정 | 구간추정 |
- 모수 : 모집단을 조사하여 얻을 수 있는 통계적인 특성치를 모수(Population Prameter)라고 하며 모집단 분포의 특성을 규정짓는 척도이다. (예: 평균, 분산, 표준편차, 백분위수 등)
일반적으로 모수는 알려져 있지 않은 미지의 상수로써 취급되며 통계적 추론을 통해 모수를 추론할 수 있다.
*통계적 추론 : 모집단에서 추출한 표본 특성을 분석하여, 모수에 대해 추측/추론을 하는 과정
- 모집단의 평균(모평균)을 추정하기 위한 추정량으로 표본평균이 대표적
- 모집단의 분산(모분산)을 추정하기 위한 추정량으로 표본분산이 대표적
- 점추정 : 가장 참값이라고 여겨지는 하나의 모수 값을 선택하는 것. 모수가 특정한 값일 것이라고 추정하는 것.
- 구간추정
- 모수가 특정한 구간에 있을 것이라는 개념으로 신뢰구간을 추정하는 방법
- 신뢰수준 : 90%, 95%, 99%의 확률을 이용하는 경우가 많다
- 신뢰수준 95% : 한 개의 모집단에서 동일한 자료의 확률표본을 무한히 추출하여 각 확률표본마다 신뢰구간을 구하면, 무한히 많은 신뢰구간 중 95%의 신뢰구간이 미지의 모수를 포함한다는 의미
- 모집단의 확률분포를 정규분포라 가정할 때, 95% 신뢰수준 하에서 모평균 μ의 신뢰구간
2. 가설검정
- 모집단에 대한 귀무가설(H0)과 대립가설(H1)을 설정한 뒤, 표본관찰 또는 실험을 통해 하나를 선택하는 과정
- 귀무가설이 옳다는 전제하에 관측된 검정통계량의 값보다 대립가설을 지지하는 값이 나타날 확률을 구하여 가설의 채택여부 결정
* 귀무가설(H0) : 대립가설과 반대의 증거를 찾기 위해 정한 가설
* 대립가설(H1) : 증명하고 싶은 가설
3. p-value
- 귀무가설이 옳다는 가정하에 얻은 통계량이 귀무가설을 얼마나 지지하는 지를 나타낸 확률
- p-value의 값이 적을수록 귀무가설을 기각할 가능성이 높아진다
- p-value의 값이 유의 수준( α ) 보다 작으면 귀무가설을 기각한다
4. 가설검정의 오류
- 제1종 오류와 제 2종 오류는 상충관계가 있음
- 제1종 오류의 확률을 0.1, 0.05, 0.01 등으로 고정한 뒤, 제2종 오류가 최소가 되도록 기각역을 설정한다
- 기각역 : 귀무가설을 기각하는 통계량의 영역
정확한 사실\가설검정 결과 | 귀무가설(H0)이 사실이라고 판정 | 귀무가설(H0)이 사실이 아니라고 판정 |
귀무가설(H0)이 사실임 | 옳은 결정 | 제 1종 오류(α) |
귀무가설(H0)이 사실이 아님 | 제2종 오류(β) | 옳은 결정 |
'Data > ADsP' 카테고리의 다른 글
[ADsP] 모수 검정 (0) | 2023.10.05 |
---|---|
[ADsP] 확률 및 확률분포 (2) | 2023.10.05 |
[ADsP] 통계 분석 개요 (1) | 2023.10.05 |