변형된 퍼셉트론 알고리즘을 사용한 이중언어 어휘 추출
DC Field | Value | Language |
---|---|---|
dc.contributor.author | 권홍석 | - |
dc.date.accessioned | 2017-02-22T06:06:53Z | - |
dc.date.available | 2017-02-22T06:06:53Z | - |
dc.date.issued | 2014 | - |
dc.date.submitted | 57044-06-26 | - |
dc.identifier.uri | http://kmou.dcollection.net/jsp/common/DcLoOrgPer.jsp?sItemId=000002174970 | ko_KR |
dc.identifier.uri | http://repository.kmou.ac.kr/handle/2014.oak/9112 | - |
dc.description.abstract | 전산 언어학 분야에서 병렬 말뭉치와 이중언어 어휘는 기계번역과 교차 정보 탐색 등의 분야에서 중요한 자원으로 사용되고 있다. 예를 들어, 병렬 말뭉치는 기계번역 시스템에서 번역 확률들을 추출하는데 사용된다. 이중언어 어휘는 교차 정보 탐색에서 직접적으로 단어 대 단어 번역을 가능하게 한다. 또한 기계번역 시스템에서 번역 프로세스를 도와주는 역할을 하고 있다. 그리고 학습을 위한 병렬 말뭉치와 이중언어 어휘의 용량이 크면 클수록 기계번역 시스템의 성능이 향상된다. 그러나 이러한 이중언어 어휘를 수동으로, 즉 사람의 힘으로 구축하는 것은 많은 비용과 시간과 노동을 필요로 한다. 이러한 이유들 때문에 이중언어 어휘를 추출하는 연구가 많은 연구자들에게 각광받게 되었다. 본 논문에서는 이중언어 어휘를 추출하는 새롭고 효과적인 방법론을 제안한다. 이중언어 어휘 추출에서 가장 많이 다루어지는 벡터 공간 모델을 기반으로 하고, 신경망의 한 종류인 퍼셉트론 알고리즘을 사용하여 이중언어 어휘의 가중치를 반복해서 학습한다. 그리고 반복적으로 학습된 이중언어 어휘의 가중치와 퍼셉트론을 사용하여 최종 이중언어 어휘들을 추출한다. 그 결과, 학습되지 않은 초기의 결과에 비해서 반복 학습된 결과가 평균 3.5%의 정확도 향상을 얻을 수 있었다 | - |
dc.description.tableofcontents | 1. Introduction 2. Literature Review 2.1 Linguistic resources: The text corpora 2.2 A vector space model 2.3 Neural networks: The single layer Perceptron 2.4 Evaluation metrics 3. System Architecture of Bilingual Lexicon Extraction System 3.1 Required linguistic resources 3.2 System architecture 4. Building a Seed Dictionary 4.1 Methodology: Context Based Approach (CBA) 4.2 Experiments and results 4.2.1 Experimental setups 4.2.2 Experimental results 4.3 Discussions 5. Extracting Bilingual Lexicons 4.1 Methodology: Iterative Approach (IA) 4.2 Experiments and results 4.2.1 Experimental setups 4.2.2 Experimental results 4.3 Discussions 6. Conclusions and Future Works | - |
dc.language | eng | - |
dc.publisher | 한국해양대학교 대학원 | - |
dc.title | 변형된 퍼셉트론 알고리즘을 사용한 이중언어 어휘 추출 | - |
dc.title.alternative | Bilingual Lexicon Extraction Using a Modified Perceptron Algorithm | - |
dc.type | Thesis | - |
dc.date.awarded | 2014-08 | - |
dc.contributor.alternativeName | Hongseok Kwon | - |
Items in Repository are protected by copyright, with all rights reserved, unless otherwise indicated.