한국해양대학교

Detailed Information

Metadata Downloads

트랜스포미기반 한국어 의학용어 탐지 및 해석

Title
트랜스포미기반 한국어 의학용어 탐지 및 해석
Alternative Title
Detecting and Interpreting Korean Medical Terms Based on Transformer
Author(s)
염하람
Keyword
전문용어 탐지, 전문용어 해석, 기계 번역, 트랜스포머
Issued Date
2023
Publisher
한국해양대학교 대학원
URI
http://repository.kmou.ac.kr/handle/2014.oak/13253
http://kmou.dcollection.net/common/orgView/200000670234
Abstract
의학용어는 의학 분야에서 사용하는 전문 언어를 말한다. 의학용어의 대부분
은 이음동의어 형태를 가지며, 외국어에서 유래한 것이 많다. 긴 의학용어는
약어로 많이 사용되기 때문에 의학용어로 이루어진 문서를 대중이 보고 이해
하기에 어려움이 있다. 이러한 문제를 해결하기 위해 본 논문은 기계 번역 모
델을 이용한 의학용어를 자동으로 탐지하고 해석하는 모델을 제안한다. 기계
번역 모델에 적용하기 위해 다음과 같은 방법으로 병렬 말뭉치를 구축한다. 1)
의학용어 사전을 구축한다. 2)의학 문서를 수집한다. 3)의학 병렬 말뭉치를 제
작한다. 구축된 병렬 말뭉치를 이용하여 사전학습 언어모델과 트랜스포머기반
의학용어 탐지 및 해석모델을 구축한다. 의학 병렬 말뭉치의 문장은 음절 단위
로 토큰화한 후 KoCharELECTRA를 이용하여 표상을 얻는다. 의학용어 탐지
및 해석 모델은 평가 말뭉치에 존재하는 의학용어의 약 93%의 용어를 탐지했
다. 제안 모델의 BLEU 점수는 음절 및 어절 단위 각각 0.987 및 0.981,
ROUGE 점수는 음절 및 어절 단위 각각 0.993 및 0.987로 높은 번역 성능을
보인다. 의학용어 탐지 및 해석 모델의 제안으로 비전문가인 대중이 의학 문서
를 쉽게 접하고 이해할 수 있을 것이다.
Appears in Collections:
기타 > 기타
Files in This Item:
There are no files associated with this item.

Items in Repository are protected by copyright, with all rights reserved, unless otherwise indicated.

Browse