2011년 6월 1일 수요일

데이터마이닝의 개요

데이터마이닝의 정의와 활용분야
- 데이터마이닝은 "대용량의 데이터" → "의미있는 정보" → "의사결정"의 과정임
- 데이터마이닝은 소매, 은행, 보험, 통신, 제조, 유통, 의료 등 여러 분야에서 활용이 가능함

데이터마이닝 관련분야와 용어
- 데이터마이닝은 KDD, 통계학, 데이터베이스, 기계학습, 인공신경망, OLAP 등과 관련이 있으며 이들은 상호 보완적으로 정보의 발굴 작업을 수행

데이터마이닝 적용사례
- 데이터베이스 마케팅, 신용점수 (Credit Score), 우수고객점수 (Loyalty Score), 고객이탈 및 연체점수(Attrition Score), 구매가능점수 등의 산출, 도용사고 방지 (Fraud Detection), 위험관리 (Risk Management) 등에 적용

데이터마이닝 프로젝트의 유의점
- 현 비즈니스의 문제에 대한 정확한 이해가 가장 중요하며, 충실한 자료와 전문인력 확보 및 원활한 조직간 협력 및 전사적 지원이 필요함 즉, 데이터를 제공해주는 부서와 이를 활용하는 부서, 그리고 모델을 개발하는 부서 모두 협력하여 진행

댓글 없음:

댓글 쓰기

ETL 솔루션 환경

ETL 솔루션 환경 하둡은 대용량 데이터를 값싸고 빠르게 분석할 수 있는 길을 만들어줬다. 통계분석 엔진인 “R”역시 하둡 못지 않게 관심을 받고 있다. 빅데이터 역시 데이터라는 점을 볼때 분산처리와 분석 그 이전에 데이터 품질 등 데이...