作者
Jebran Khan, Sungchang Lee
发表日期
2020/6
期刊
한국통신학회논문지
卷号
45
期号
6
页码范围
1027-1037
简介
본 논문에서는 노이지 텍스트(noisy text)들을 제거하지 않고 정정하여 활용함으로써 소셜미디어 텍스트의 감성분석 (sentiment analysis)를 개선하는 새로운 방법을 제안하였다. 소셜미디어 텍스트는 특정 언어에 대한 작성자의 한정된 언어능력, 인지적 혹은 오타의 철자오류, 약자나 줄여쓰기의 사용, 감정의 표현 등으로 인해서 수많은 변형과 비일관성을 가진다. 이러한 변형들은 사전적으로 근거없는 (misspelled words) 단어가 되어 노이즈 (noise)로 간주된다. 대부분의 기존의 방식들은 이러한 노이즈를 여과하여 제거하거나 혹은 이 변형들을 위한 별도의 사전을 만든다. 전자에서는 감성 정보의 손실을 초래하며, 후자는 특정 응용 별로 의존적인 단점이 있다. 본 논문에서는 형식을 갖추지 않은 소셜미디어 텍스트에서의 비일관적 변형들을 자동적으로 처리할 수 있는 포괄적 방안을 제시하였다. 제안된 방안에서는, 노이지 텍스트들을 제거하는 대신에 이들을 바로잡는 정정을 함으로써 이들에 포함된 감성정보를 보존하여 사용하며, 앙상블 …
引用总数