본문 바로가기

Data/ADsP

[ADsP] 통계 분석 개요

1. 데이터 이해 
1-1. 데이터의 이해 
1-2. 데이터의 가치와 미래 
1-3. 가치 창조를 위한 데이터 사이언스와 전략 인사이트 

2. 데이터 분석 기획 
2-1. 데이터 분석 기획의 이해 
2-2. 분석 마스터 플랜 

3. 데이터 분석 
3-1. R 기초와 데이터 마트 

3-2. 통계분석 

  3-2-1. 통계학 개론

  3-2-2. 기초 통계분석

  3-2-3. 다변량 분석

  3-2-4. 시계열 에측

  3-2-5. 다차원 척도법

  3-2-6. 주성분 분석

3-3. 정형 데이터 마이닝

 

통계학 개론

통계 분석 개요

확률 및 확률분포

추정과 가설검정

모수 검정

 

통계 분석 개요

 

1) 통계학의 정의

자료로부터 유용한 정보를 이끌어 내는 학문, 유용한 정보를 이끌어내는 작업에는 자료의 수집과 정리, 그리고 이를 해석하는 방법 모두 포함

 

2) 모집단과 표본

모집단은 유한 모집단과 무한 모집단으로 나뉜다.

보통 개념적으로 상정된 모집단은 무한 모집단을 의미한다.

 

3) 표본추출의 방법

표본조사를 할 때는 모집단의 정의, 표본의 크기, 조사방법, 조사기간, 표본추출 방법을 명확하게 밝히거나 확인해야 한다.

가장 대표적인 방법으로는 단순임의추출법, 계통추출법, 집락추출법, 층화추출법 등이 있다.

 

  1. 단순임의 추출법 : 각 원소에 임의 번호 부여 후 → N개의 번호를 임의 선택
  2. 계통 추출법 : 모집단의 모든 원소에 일련번호 부여 → 순서대로 나열 후 K개씩 N개의 구간으로 나눈 후, 각 구간에서 하나를 임의로 선택
  3. 집락 추출법 : 일부 집락을 임의로 선택 → 각 집락에서 표본을 임의 선택
  4. 층화 추출법 : 서로 유사한 것끼리 몇 개의 층으로 나눈 후 표본을 임의 추출

* 표본조사 외에 실험으로 자료를 수집할 수 있다. 특정 목적하에 실험 대상에서 처리 후 결과를 관측해 자료 수집

* 표본조사는 대상 집단의 일부 추출함 → 현상 관측 또는 조사

 


자료의 종류

척도 순서 균등학 간격 절대적 존재
명목척도 x x x
순서척도 o x x
구간척도 o o x
비율척도 o o o
  1. 질적 자료(qualitative data)
    - 명목 척도 : 어느 집단에 속할지 - 성별, 출생지 등
    - 순서 척도 : 서열관계, 선택사항이 일정한 순서로 되어 있음(선호도)

  2. 양적 자료(quantitative data)
    - 구간 척도 : 속성의 양을 측정, 절대적인 원점 X, 비율은 의미 X(온도, 지수 등)
    - 비율 척도 : 절대적 기준인 0값 존재, 사칙연산 가능, 숫자로 관측되는 일반적인 자료의 특성(무게, 나이, 연간소득, 제품 가격 등)

* 측정 : 표본조사나 실험을 하는 과정에서 추출된 원소들 또는 실험 단위로 주어진 목적에 접합하도록 관측해 획득한 자료

* 측정방법 : 명목척도, 순서척도, 구간척도, 비율척도

 

 

 

(Different types of data, Wikilean)

 

통계분석

특정한 집단이나 불확실한 현상을 대상으로 자료를 수집해 대상 집단에 대한 정보를 구하고, 적절한 통계 분석 방법을 이용해 의사결정을 하는 과정

 

통계적 추론 : 수집된 자료를 이용해 대상 집단에 대해 의사결정 하는 것

 

- 대상 집단의 특성값이 무엇일까? : 추축(추정)

- 가설의 채택여부를 결정 : 가설 검정

- 미래의 불확실성을 해결해 효율적인 의사결정을 목적으로 수행 : 예측

- 평균, 표준편차, 중위수, 최빈값, %와 같이 숫자로 표현하는 방식, 막대그래프 등 그래프로 나타내는 방식

* 기술 통계 : 수집된 자료를 정리, 요약하기 위해사 사용되는 기초적인 통계(자세한 통계적 분석을 위한 사전단계 역할)

 

 
 
 
반응형

'Data > ADsP' 카테고리의 다른 글

[ADsP] 모수 검정  (0) 2023.10.05
[ADsP] 추정과 가설검정  (0) 2023.10.05
[ADsP] 확률 및 확률분포  (2) 2023.10.05