2012. 3. 23. 10:30ㆍData Science/Seminar
지난 2012년 2월 15일 참석한 제7회 ACC 컨퍼런스 주요 내용입니다.
o 빅데이터의 정의란 무엇인지 o Past BI와 Future Analytics의 차이점 o 데이터사이언티스트는 누구인지 등에 대해서 알아봤습니다.
빅데이터의 정의를 3V(variety, velocity, volume) + Complexicity 으로 볼수도 있고, 기업, 기관이 보유하고 있는 데이터, 기존 IT인프라가 처리할 수 없는 데이터, 빅데이터를 Non-relational과 Relational data의 관점의 데이터 라고 하는 등의 정의를 말씀해주셨습니다. 많이 통용되고 있는 빅데이터의 정의는 3V관점에서 생겨나는 데이터라고 할 수 있고, 대표님께서는 기업이 가지고 있고, 기존의 인프라로 처리할 수 없는 데이터를 빅데이터라고 말씀하셨습니다. 테라데이터에서 말씀하신 정의는 저에게는 새로웠는데요, 관계형, 비관계형 관점에서 데이터를 구분하여 빅데이터를 정의한 점이 새로웠습니다. http://www.zdnet.co.kr/news/news_view.asp?artice_id=20120215132844 에 보시면 보다 자세한 내용을 확인하실수 있습니다. 최교수님 패널 진행자료는 http://bit.ly/acc7th_discussion 에서 확인하실 수 있습니다.
그 다음으로는 개인적으로 Track I에 남아서 발표를 들었습니다. 첫번째 세션은,
"소셜분석, 빅데이터의 시대 기업활동에 소셜데이터 활용하기 - 기업, 소셜에 길을 묻다"란 주제로 SK Telecom의 김정선 차장님이 발표하셨습니다. 통신사의 경우 고객의 데이터가 특히 중요한데, 고객 데이터 분석을 SK Telecom에서는 Smart Insight라는 솔류션을 가지고 있다고 하였습니다. Smart Insight를 통해, 고객의 소셜데이터를 수집, 분석, 보고 하는 것에 활용하고 있다고 하였습니다.(버즈 모니터링이 중요하단 생각이 드는데요. 버즈: 고객이 내는 의견) SNS분석은 크게 빈도분석, 네트워크 분석, Opinion Mining분석으로 나뉘고 이를 통해 다수의 고객에 대한 정성조사, 실시간 프로모션 반응 분석, 경쟁사 활동관련 모니터링 가능하다고 하였습니다. Smart Insight 관련 사이트는 www.smartinsight.co.kr 입니다.
이어진 세션에서 마이크로스트레티지의 김연희 부장(원래는 이동협 차장님 발표인데 바뀌었나보네요)님이 "소셜 인텔리전스, 소셜미디어 분석 관리 최적화 전략"에 관해 발표 하셨습니다. 마이크로스트레티지에서 얘기한 것중에 새로운 개념은 Social을 Friendly intelligence라고 얘기한다는 점, 페이스북의 좋아요를 기능을 활용해 고객에 대해 분석하는 점 등이 매우 흥미로웠습니다. 좋아요를 누를때 고객 정보를 제공한다고 동의하고 마이크로스트레티지는 이걸 활용해 분석정보를 얻어낸다는 것인데요.. 좋아요를 누르면 분석정보를 제공한다는 점은 알았지만, 실제로 분석결과를 눈으로 보니 신선했습니다. 마이크로스트레티지에서 제공하는 앱이 www.wisdom.com에 가시면 다운받으실 수 있습니다. 아쉽게도 안드로이드용은 아직 나오지 않은 것 같습니다.
다음 세션에서는 "Big Data시대의 Bi의 역할과 활용방안"란 주제로 SK C&C 전철희 위원이 발표하셨습니다. 개인적으로 봤을 때 빅데이터 분석에 대해 가장 디테일 하게 장표로 표현하셨습니다. 내부데이터와 외부데이터로 구분하여 설명하신점이 새로웠습니다. 그리고 SK C&C가 주력하고 있는 점은 Non-SQL의 관점에서 SQL로의 연계를 어떻게 가져갈까 하는 부문이라고 하셨습니다.
다음 발표는 "Business playform, 21세기를 위한 애널리틱스"로 Tibco의 임상수 부장님께서 발표하셨습니다. Tibco의 platform은 automation playform, event processing, analytics, social, cloud의 관점을 가지고 있다고 하였습니다. 사용자 중심의 Visualization이 중요하다고 인식하고 있고, Spotfire라는 솔류션이 있는데 이를 통해 다양한 관점의 분석 결과물을 제공하고 있다고 하였습니다.
마지막으로 SK Telecom에서 실제로 분석하고 있던 부문에 대한 설명이 있었습니다. 분석의 목적은 고객들이 네트워크를 통해 말하는 의견에 대한 분석을 통해 대응을 하는 것이 주목적입니다. Data Paradox라는 그림을 가지고 설명하시면서, 정보를 많이 가지고 있다고 해서 좋은 것은 아니다란 의견을 말씀해주셨는데요. 또한, 10000 : 100 vs. 60 : 15 의 예를 들면서 트위터에서 만명의 폴로워를 가진 자중 100명이 어떤 의견을 리트윗했을 경우와 60명중에서 15명이 리트윗했을 경우는 보면, 비율적으로 봤을때는 60명중의 15명이 4:1로 더 많은 사람들이 의견을 개진했지만, 만명중의 100명의 의견이 더욱 파급효과가 사실 더 큽니다. 이는 분석에서 놓칠수 있는 부문이다라고 하셨습니다. 버즈분석을 할때 Issue keyword, Related Keywords, Appealing point, pain point로 나뉘어 분석한다고 합니다.
이렇게 7th ACC 세션은 막을 내렸습니다.