한국해양대학교

Detailed Information

Metadata Downloads

한국어 격조사 복원에 대한 실험적 고찰

DC Field Value Language
dc.contributor.author 황보천 -
dc.date.accessioned 2017-02-22T07:15:49Z -
dc.date.available 2017-02-22T07:15:49Z -
dc.date.issued 2013 -
dc.date.submitted 57016-04-17 -
dc.identifier.uri http://kmou.dcollection.net/jsp/common/DcLoOrgPer.jsp?sItemId=000002176174 ko_KR
dc.identifier.uri http://repository.kmou.ac.kr/handle/2014.oak/10537 -
dc.description.abstract This thesis is an experimental study on case particle restoration in Korean. The case particles in Korean sentences are omitted frequently. The omitted particles cause ambiguity in syntactic attachment and decrease performance of syntactic analysis. In this thesis, we restore the omitted case particles using machine learning techniques and suggest the most proper features for case particle restoration. The system for restoring omitted particles can be one component in the parsing system and also can be used for indexing terms in information retrieval. We have done experiments on several experimental settings and have observed the results. For the experiments, we have used ETRI syntactic tree-tagged corpus. The correct restoration rate of the system is 81.11 in accuracy of omitted case particles. We have observed that nouns and verbs, themselves, are very important features for restoring case particles. -
dc.description.tableofcontents List of Tables ⅳ List of Figures ⅴ Abstract ⅵ 1. 서 론 1 2. 관련 연구 2.1 ETRI 구문구조 부착 말뭉치 3 2.2 Conditional Random Fields 4 2.3 의존관계 분석 6 3. 격조사 복원시스템 3.1 개요 7 3.2 ETRI 말뭉치 추출기 8 3.3 격조사 복원 자질 추출기 3.3.1 격조사 복원 자질집합 11 3.3.2 격조사 복원 자질 추출기 15 3.4 격조사 복원기 20 4. 실험 및 평가 4.1 실험환경 23 4.2 체언과 용언 사이의 거리 분석 24 4.3 격조사 복원 성능 4.3.1 실험방법 25 4.3.2 격조사 복원 성능분석 28 4.4 거리별 격조사 복원 성능분석 4.4.1 전체 거리별 성능분석 29 4.4.2 거리 1과 2의 성능분석 30 4.5 자질별 중요도 분석 33 5. 결론 및 향후 연구 38 감사의 글 40 참고문헌 41 부록 A 원시 말뭉치의 한글 및 영문 태그 사용 예 43 -
dc.language kor -
dc.publisher 한국해양대학교 대학원 -
dc.title 한국어 격조사 복원에 대한 실험적 고찰 -
dc.title.alternative Experimental Study on Case Particle Restoration in Korean -
dc.type Thesis -
dc.date.awarded 2013-08 -
Appears in Collections:
컴퓨터공학과 > Thesis
Files in This Item:
000002176174.pdf Download

Items in Repository are protected by copyright, with all rights reserved, unless otherwise indicated.

Browse