2011년 6월 1일 수요일

데이터마이닝: 기초통계

통계학의 개요
통계학 : 관심 또는 연구의 대상이 되는 전체집단으로부터 자료를 수집·정리하고 과학적으로 분석하여, 최적의 의사결정을 할 수 있도록 정확한 정보를 제공하는 방법론을 연구하는 학문

추론통계학
관심의 대상이 되는 전체집단(모집단)으로부터 일부를 뽑아 관측된 (표본)내용을 근거로 하여 모집단의 전체특성을 추측하고 검정(추론)하는 통계적 방법을 다루는 통계학
가설검정
모수에 대한 가설의 타당성에 대하여 경험적 증거를 제시하는 과정
1단계 가설을 세운다.
- 귀무가설  : 효과가 없다, 차이가 없다, 서로 다르지 않다(반증의 대상)
- 대립가설  : 효과 있다, 차이가 있다, 서로 다르다(연구의 대상)
2단계 유의수준  정한다.
3단계 검증 통계량을 정한다.
4단계 관측된 자료에 대한  p-값을 계산한다.
5단계 p-값 이 주어진 유의수준 보다 작은 경우 귀무가설을 기각한다.

분할표분석
수집된 결과를 어떤 속성에 따라 분류하여 도수(frequency)로 주어지는 자료를 범주형 자료(categorical data)라고 하는데 범주형자료는 분할표형태로 정리할 수 있다.

댓글 없음:

댓글 쓰기

블록체인 개요 및 오픈소스 동향

블록체인(block chain) 블록체인은 공공 거래장부이며 가상 화폐로 거래할때 발생할때 발생할 수 있는 해킹을 막는 기술. 분산 데이터베이스의 한 형태로, 지속적으로 성장하는 데이터 기록 리스트로서 분산 노드의 운영자에 의한 임의 조작이 불가...