한국해양대학교

Detailed Information

Metadata Downloads

LAN_GCN을 활용한 한국어 혐오표현 탐지

Title
LAN_GCN을 활용한 한국어 혐오표현 탐지
Alternative Title
Korean Hate Speech Detection using LAN_GCN
Author(s)
박경수
Keyword
심층학습, GCN, 혐오표현 탐지, 표지 주의집중망, 문장 분류
Issued Date
2023
Publisher
한국해양대학교 대학원
URI
http://repository.kmou.ac.kr/handle/2014.oak/13129
http://kmou.dcollection.net/common/orgView/200000668033
Abstract
인터넷 이용률은 계속 증가하고 있고 우리는 수많은 글을 접하게 된다. 좋은 정보를 주는 글도 많지만 그만큼 혐오표현이 사용된 악성 댓글과 같은 글에도 많이 노출되고 이는 사회적으로 많은 문제가 된다. 혐오표현을 막기 위한 제도적인 노력도 있었으나 혐오표현으로 인한 문제는 완화되지 않았다. 최근에는 심층학습을 이용하여 혐오표현을 탐지하는 연구가 진행되고 있다. 국외에서는 활발한 연구가 이루어지고 있지만, 국내에서는 연구가 미비한 실정이다. 본 논문에서는 한국어에 대해 혐오표현을 탐지하는 심층학습 모델인 LAN_GCN 모델을 제안한다. 제안하는 모델은 사전학습된 언어 모델을 기반으로 토큰화하고 표상된 문장을 입력받고 GCN(Graph Covolutional Network) 층과 LAN(Label Attention Network) 층을 순차적으로 통과하여 문장의 표지에 대해 예측한다. 공개된 말뭉치인 Korean HateSpeech 말뭉치에 대해 제안 모델은 거시 F1 점수 64.0%을 달성하여 기준 모델보다 10%p 향상된 성능을 보였다. 추후 공개된 영어 혐오표현 말뭉치에도 적용해본 뒤 더 나아가 다른 문서 분류 작업에도 적용하여 성능을 검증할 예정이다.
Appears in Collections:
기타 > 기타
Files in This Item:
There are no files associated with this item.

Items in Repository are protected by copyright, with all rights reserved, unless otherwise indicated.

Browse