Data mining은 광산에서 광물을 캐내듯이 기업들이 축적해 놓은 방대한 데이터베이스(data base)에서 사용자가 필요로 하는 정보를 취합해서 뽑아내는 기술이다.
대량의 데이터로부터 새롭고 의미있는 정보를 추출하여 의사결정에 활용하는 작업으로 용어에 '채굴하다'라는 의미의 'mining'을 포함시킨 이유는 데이터로부터 정보를 찾아내는 작업이 마치 금이나 다이아몬드를 발견하기 전에 수많은 양의 흙과 잡석들을 파헤치고 제거하는 것과 유사하다는 데에 기인한다.
데이터 마이닝(data mining)은 대규모로 저장된 데이터 안에서 체계적이고 자동적으로 통계적 규칙(rule)이나 패턴(pattern)을 찾아 내는 것이다. 다른 말로는 KDD(데이터베이스 속의 지식 발견: knowledge-discovery in database)라고도 일컫는다. 이를 위해서, 데이터 마이닝은 통계학에서 패턴 인식에 이르는 다양한 계량 기법을 사용한다.
대용량의 데이터로부터 유용하게 활용될 수 있는 지식을 효과적으로 찾아내는 지식 탐사의 한 연구분야이다.
01.16 09:50