한국해양대학교

KMOU Repository 한국해양대학교 기타 기타

Metadata Downloads

LAN_GCN을 활용한 한국어 혐오표현 탐지

URI: http://repository.kmou.ac.kr/handle/2014.oak/13129
http://kmou.dcollection.net/common/orgView/200000668033

Abstract: 인터넷 이용률은 계속 증가하고 있고 우리는 수많은 글을 접하게 된다. 좋은 정보를 주는 글도 많지만 그만큼 혐오표현이 사용된 악성 댓글과 같은 글에도 많이 노출되고 이는 사회적으로 많은 문제가 된다. 혐오표현을 막기 위한 제도적인 노력도 있었으나 혐오표현으로 인한 문제는 완화되지 않았다. 최근에는 심층학습을 이용하여 혐오표현을 탐지하는 연구가 진행되고 있다. 국외에서는 활발한 연구가 이루어지고 있지만, 국내에서는 연구가 미비한 실정이다. 본 논문에서는 한국어에 대해 혐오표현을 탐지하는 심층학습 모델인 LAN_GCN 모델을 제안한다. 제안하는 모델은 사전학습된 언어 모델을 기반으로 토큰화하고 표상된 문장을 입력받고 GCN(Graph Covolutional Network) 층과 LAN(Label Attention Network) 층을 순차적으로 통과하여 문장의 표지에 대해 예측한다. 공개된 말뭉치인 Korean HateSpeech 말뭉치에 대해 제안 모델은 거시 F1 점수 64.0%을 달성하여 기준 모델보다 10%p 향상된 성능을 보였다. 추후 공개된 영어 혐오표현 말뭉치에도 적용해본 뒤 더 나아가 다른 문서 분류 작업에도 적용하여 성능을 검증할 예정이다.

메타데이터 전체 보기

qrcode

OAK

ywm85@kmou.ac.kr Tel: 051-410-4085

KMOU Repository는 국립중앙도서관 OAK Repository 보급사업으로 구축되었습니다.