비즈니스 측면의 데이터 사이언스

2013. 4. 16. 02:36Data Science/Insights(시사점)


2012년을 기점을 화두가 되고 있는 IT 트렌드가 있다. 빅데이터이다. 가트너는 빅데이터를 통해 2015년까지 빅데이터 수요 증가로 440만개의 일자리가 창출될 것이라고 내다봤다. 그만큼, 빅데이터에 대한 사람들의 관심과 시장의 니즈가 크다는 것을 의미한다.


빅데이터는 전에도 언급했지만, 기존의 데이터 수집/저장/처리 기술로는 감당하기 힘든 다양하고 빠르게 생성되며, 데이터 볼륨이 큰 데이터를 말한다. 이러한 빅데이터 출현 계기로 비즈니스 상에서 새롭게 언급되는 분야가 있는데, 바로 데이터 과학(Data Science), 또는 편의상 데이터 사이언스 분야이다.




데이터 사이언스는 말 그대로 데이터에 대한 학문이다. 현 빅데이터에 대한 언급과 뜨거운 관심이 있기 전에도 과학 분야에서 활용하는 데이터에 대한 관리 및 활용 측면에서 데이터 사이언스에 대한 언급이 있었다. 이러한 관점으로 데이터 사이언스를 연구하는 관련 채널에는 IASC(International Association for Statistical Computing), ISI(국제통계기구), CODATA(Committee on Data for Science and Technology) Data Science 저널, 콜럼비아 대학의 The Journal of Data Science” 등이 있다.

 

처음 데이터 사이언스에 대해 자유롭게 언급한 사람은 Peter Naur란 학자로서, 1974년 작성한 “Concise Survey of Computer Methods” 책에서 ‘Data Science’에 용어가 자유롭게 언급되고 있다.

 

최근 들어, IT 기술이 발전함에 따라 데이터 사이언스에 대한 관점이 사뭇 달라졌다. 여기서 IT기술이라는 것은 데이터를 처리하기 위한 수집/저장/처리 인프라, 데이터를 분석하는데 활용하는 분석도구, 접근성이 허용된 오픈데이터를 통칭하는 것이다.

 

이러한 IT기술이 발전함에 따라 기존에는 관리하지 못한 데이터를 저장 및 들여다 볼 수 있게 되었고, 이러한 데서 기회를 찾고자 하는 사람들이 생겨났으며, 혹자들은 이들을 데이터 사이언티스트라 부르고 있다.

 

기존에 보지 못했던 데이터에는, 저장하기 힘들어 버렸던 로그 데이터부터 시작하여, 인터넷상에 혜성과 같이 등장하여 온라인 소셜 세계를 움켜진 트위터와 페이스북의 데이터를 포함한다. 새로운 데이터를 들여다 볼 수 있게 된 환경에서, 새로운 전략과 전술을 찾아 헤매던 IT관련 비즈니스 업체들이 데이터 쪽에 관심을 가지면서, 이 분야를 비즈니스적 측면의 데이터 사이언스라 부르게 되었다.

 

 2010O’Reilly Media 소속의 Mike Loukides“What is data science?”란 아티클을 통해 처음으로 비즈니스적 측면에서 빅데이터와 연계한 데이터 사이언스에 대해 발표했다. 그 이후, 역시 같은 소속의 DJ Patil2011년 동일 미디어를 통해 “Building Data Science Teams”란 아티클을 통해 데이터 사이언스를 수행하기 위한 팀 역량에 대해 언급한다.

 

Drew Conway란 박사과정의 학생은 데이터 사이언스를 해킹 스킬, 수학과 통계 지식, 전문지식의 교차점에 있는 학문이라고 표현하였다. , 데이터 사이언스란 여러 방면의 지식을 융합하여 활용하는 분야라고 표현하며, 이는 현 융합 관점과 맞물린다.

 

비즈니스 측면의 데이터 사이언스는 Drew Conway가 언급한 능력과 전문지식을 통해 궁극적으로 데이터에서 의미 있는 결과를 찾아내는 학문이다. 이러한 인사이트를 도출하기 위해서는 데이터를 심도 있게 바라볼 수 있는 능력, 이러한 의미를 찾기 위한 통계적 기반 지식, 업무 지식이 뒷받침 되어야 하며, 이에 적합한 사람들을 (위에서도 언급했지만) 데이터 과학자 또는 데이터 사이언티스트라 부른다.

 

데이터 사이언스 분야는 새로운 것을 찾고자 하는 비즈니스 업계에 큰 영향을 미치고 있고, 앞으로도 전략차원에서 활용가능한 학문으로 자리 매김 할 것이다.