Data mining은 광산에서 광물을 캐내듯이 기업들이 축적해 놓은 방대한 데이터베이스(data base)에서 사용자가 필요로 하는 정보를 취합해서 뽑아내는 기술이다. 대량의 데이터로부터 새롭고 의미있는 정보를 추출하여 의사결정에 활용하는 작업으로 용어에 "채굴하다"라는 의미의 mining을 포함시킨 이유는 데이터로 부터 정보를 찿아내는 작업이 마치 금이나 다이아몬드를 발견하기전에 수많은 양의 흙과 잡석등을 파헤치고 제거하는 것과 유사하다는 데에 기인한다. 데이터마이닝은(data Mining)은 대규모로 저장된 데이터 안에서 체계적이고 자동적으로 통계적 규칙(Rule)이나, 패턴(pattern)을 찿아 내는 것이다. 다른 말로는 KDD(데이터베이스 속의 지식발견:Knowledre-discovery in datdbase)라고도 일컫는다. 이를 위해서,데이터마이닝은 통계학에서 패턴 인식에 이르는 다양한 개량 기법을 사용한다. 대용량의 데이터로부터 유용하게 활용될 수 있는 지식을 효과적으로 찿아내는 지식 탐사의 한 연구분야이다.
07.13 14:47