Data Science/Analytics2012.10.26 00:50

출처 : Wikipedia(http://en.wikipedia.org/wiki/Sentiment_analysis)에 나온 Sentiment 분석에 대한 소개를 요약하면 다음과 같다.

o 감성 분석의 기본 타스크는 주어진 문서, 문장, 또는 특성 레벨에서 텍스트의 양극성을 선별하는 것이다. - 문서에서 표현된 생각, 문장, 또는 엔티디 특성/모습이 긍정적인지, 부정적인지, 또는 중립적인지를 말이다. 더 나아가, "양극성을 넘어서" 감성선별은 감정적 상태, 예를 들어 "화가난", "슬픈", 그리고 "행복한"으로 나타날 수 있다.

 

o 또 다른 방법으로는 긍정적, 부정적, 또는 중립적이라고 판단된 감성에 대해 -5 ~ +5(가장 부정적에서 가장 긍정적)의 스코어를 정하는 것이다. 자연언어프로세싱을 이용해 비구조적인 텍스트를 분석할 때, 텍스트를 이해하고 그것들이 컨셉에 어떻게 관계되는지 관련 컨셉[인용 필요]이 분석된다. 각 컨셉은 감성 단어가 컨셉에 관계된 것에 기반하여 점수가 주어지고, 그것들의 연관 점수도 매겨진다.

 

o 또 다른 방법에는 Subjectivity/objectivity identification이 있다. 문장이 주관적인지, 객관적인지 파악하는 것인데, 양극성을 파악하기 전에 객관적인 문장을 배제하면 양극성 파악이 보다 용이하다고 한다.

 

o Feature/aspect-based sentiment analysis도 있다. 이는 어떤 엔티티(대상)의 특성에 대해 표현된 생각, 감성을 분석하는 것이다. 특성 또는 모습이란 엔티티(대상)의 특징 또는 요소이다. 예를 들어, 휴대폰의 스크린, 디지털 카메라의 사진 품질을 말할 수 있다. 이 분석의 어려운 점은 어떤 것이 엔티티의 요소인지 파악하는 면과, 그 요소에 대한 양극성을 선별하는 것이 이슈이다.

 

"Sentiment Analysis : A Combined Approach"에서 활용한다고 소개한 감성분석방법(P6)에는 o NLP(Natural Language Processing)와 패턴 기반 방법
o Unsupervised learning
o Maching Learning : Support Vector Machines(SVM), ID3, RIPPER
o Hybrid Classification
이 있다.

 

지금까지 정리한 것에 의하면, 감성 분석은 양극성으로 선별할 수 있고, 이를 점수를 매겨 측정하는 방법이 있다라는 것을 알 수 있다.

Posted by Curator jsl416