한국해양대학교

Detailed Information

Metadata Downloads

도어락에 적용한 화자 종속형 음성 인식 시스템 구현에 관한 연구

Title
도어락에 적용한 화자 종속형 음성 인식 시스템 구현에 관한 연구
Alternative Title
A study on the implementation of speech recognition system for speaker dependent applied to doorlock
Author(s)
정성훈
Issued Date
2005
Publisher
한국해양대학교 대학원
URI
http://kmou.dcollection.net/jsp/common/DcLoOrgPer.jsp?sItemId=000002174812
http://repository.kmou.ac.kr/handle/2014.oak/8911
Abstract
본 논문은 휴먼 인터페이스의 개념을 적용한 도어락 출입 통제시스템에 음성인식 모듈 적용 사례를 연구한 것이다. 현재 개발된 음성 인식 알고리즘은 DTW(Dynamic Time Warping), HMM(Hidden Markov Model), NN( Neural Network)이 있으며, 이 중 본 논문에서는 화자 종속형 알고리즘을 연구하였다.

우선, 다량의 데이터를 처리할 수 있는 하드웨어 선정에 TI(Texas Instruments)사의 DSP (TMS320C32)를 사용하였으며, 여러 가지 잡음처리 및 특징 추출을 모두 적용하여 테스트를 시도하였다. 특히, 본 논문에서 제안한 시스템 은 잡음에도 높은 인식률과 정확성, 빠른 수렴속도를 가지는 RLS(Recursive Least Square) 적응 필터를 사용하였다. 이 알고리즘은 필터계수가 최적의 값에 수렴하도록 파라미터 값이 바뀔 때 마다 계산을 하여 에러률을 최소화하였고, FIR 필터 구조 중 트랜스버셜(직접형)을 사용하여 계산량의 감소와 수렴속도의 개선을 가져왔다. 그리고 인식 알고리즘 테스트는 화자 종속형 DTW 이용하여 구현하였다. 테스트 적용 방법은 (주)에디텍의 SITK-32C 및 본 연구실에서 자체 설계된 보드로 테스트를 하였다. 인식 명령어 실험은 도어락 명령어(6개)로 사용하였으며, 인식 결과 화자 종속형 시스템에는 잡음 환경을 고려하여 평균 97%이상의 높은 인식률이 나왔으며, 기존의 화자 종속형 시스템 보다 FRR(본인거부률)이 2.74%가 향상되었고, 음성 인식시스템에서 가장 중요한 요소인 FAR(타인수락률)은 1.2%의 개선으로 안정된 보안 시스템임을 입증하였다.

본 논문 결과 효율적인 시스템을 구현하기 위해서 다음과 같은 내용을 유추할 수 있다. 첫 번째로 잡음 환경이 인식률에 상당한 영향을 끼치며, 이를 해결하기 위해 RLS 적응 필터 사용이 필수적이며, 두 번째로 음성 인식 알고리즘으로는 DTW가 가장 효율이 좋은 것으로 나타났으며, 끝으로 특징 추출 단계는 MFCC가 가장 이상적으로 생각된다. 마지막으로 향후 과제로 가변 어휘 기술을 이용하여 음성 DB를 구성하는 것이 필수적이라 생각한다.
Appears in Collections:
전자통신공학과 > Thesis
Files in This Item:
000002174812.pdf Download

Items in Repository are protected by copyright, with all rights reserved, unless otherwise indicated.

Browse