데이터마이닝, 빅데이터, 데이터과학: 정의 데이터마이닝(data mining) 거대한 데이터에서 인공지능, 기계학습, 통계학, 데이터베이스 시스템 등의 방 법론을 적용하여 의미 있는 패턴을 찾아가는 과정 빅데이터(big data) 본래 기존의 방법으로는 처리할 수 없을 정도로 크거나 복잡한 데이터를 지칭. 흔히 기존의 예측 혹은 분석법 적용이 어려운 데이터를 의미 데이터과학(data science) 여러 가지 형태(정형 혹은 비정형)의 데이터로부터 지식 혹은 통찰을 이끌어내 기 위한 과정 혹은 시스템에 대한 학문분야
데이터마이닝, 빅데이터, 데이터과학: 그러면??? 데이터과학은 U. of Georgia의 통계학자 Jeff Wu가 통계학 대신 데이터 과학이라고 부르자는 주장에서 유래 세 가지 용어는 각각 조금씩 다른 뜻을 내포하지만 명확히 잘 정의된 학술적인 용어라기 보다는 비즈니스의 유행어 성격이 강함 “Statistics has been the most successful information science. Those who ignore statistics are condemned to re-invent it.” by Bradley Efron (1997). 데이터로부터 유용한 정보를 얻기 위해서는 결국 통계학과 전산학을 기반으로 하여 여러 분야의 지식 혹은 협업이 필요함