유한상태 오토마타를 이용한 수식 표현 인식
DC Field | Value | Language |
---|---|---|
dc.contributor.author | 白億種 | - |
dc.date.accessioned | 2017-02-22T06:50:57Z | - |
dc.date.available | 2017-02-22T06:50:57Z | - |
dc.date.issued | 2002 | - |
dc.date.submitted | 56797-10-27 | - |
dc.identifier.uri | http://kmou.dcollection.net/jsp/common/DcLoOrgPer.jsp?sItemId=000002173976 | ko_KR |
dc.identifier.uri | http://repository.kmou.ac.kr/handle/2014.oak/9907 | - |
dc.description.abstract | There have been many trials to parse sentences in text to search complete and exact parses, but it is very hard because of unavoidable incompleteness of lexicon and grammar. Recently, to alleviate these difficulties, partial parsing appears as an alternative in the field. Partial parsing aims to recover syntactic information efficiently and reliably from unrestricted text, by sacrificing completeness and depth of analysis. As a part of partial parsing, the identification of Korean numerical expressions in text is described in this paper. Numerical expressions are required in several systems such as information extraction systems and question-answering systems. One of desired characteristics of these systems is the fastness. To achieve this goal, we use a finite-state automaton, for which we could use a tool like lex. So that we could rapidly implement the system. We observed that the system is fast and correct through several experiments. To evaluate our system, we used newspaper as test collection. We achieved the recall of 90.8%, and the precision of 86.9%. Experiments show that our system is comparatively correct. | - |
dc.description.tableofcontents | 목차 제1장 서론 = 1 제2장 관련 연구 = 3 2.1 정규표현과 유한상태 오토마타 = 3 2.2 유한상태 오토마타를 이용한 자연어 처리 방법 = 6 2.3 수식 표현 인식 시스템의 응용 = 9 제3장 한국어 수식 표현의 형식 = 11 3.1 한국어 수사 = 11 3.2 수식 표현의 형식 = 12 3.3 수식 표현의 분류 = 14 제4장 유한상태 오토마타를 이용한 수식 표현 인식 시스템 = 18 4.1 시스템 구성 = 18 4.2 수식 표현의 상태 전이도 = 19 4.3 정규표현 : 한국어 수사 인식을 위한 문법 = 20 4.4 우회 방법 = 21 4.5 어절 단위 인식 = 22 4.6 최장 구절 인식 = 22 4.7 수사와 단위성 의존명사의 연접가능성 = 23 제5장 실험 및 평가 = 26 5.1 실험 환경 = 26 5.2 평가 방법 = 26 5.3 성능 평가 = 27 5.4 오류 분석 = 30 제6장 결론 = 33 참고문헌 = 35 | - |
dc.publisher | 한국해양대학교 | - |
dc.title | 유한상태 오토마타를 이용한 수식 표현 인식 | - |
dc.title.alternative | Identification of Numerical Expressions using Finite-State Automata | - |
dc.type | Thesis | - |
Items in Repository are protected by copyright, with all rights reserved, unless otherwise indicated.