검색 상세

공간분할 및 주성분분석 벡터양자화와 다중 생체인식에의 응용

Classified Space and Principal Component Analysis Vector Quantizations and Their Applications to Multimodal Biometrics

  • 발행기관 아주대학교 대학원
  • 지도교수 이행세
  • 발행년도 2005
  • 학위수여년월 2005. 2
  • 학위명 박사
  • 학과 및 전공 일반대학원 공학계열
  • 본문언어 한국어

초록/요약

본 논문은 음성과 얼굴정보를 이용한 벡터양자기 기반의 생체인식에 관한 연구이다. 화자인식에서 사용되는 벡터양자기의 학습과 인식의 계산량을 대폭 감소시킨 공간분할 벡터양자기를 제안하고 얼굴인식에서는 아이겐공간상에서 얼굴의 변별력을 증가시키는 주성분분석 벡터양자기를 제안하였다. 그리고 얼굴과 음성정보를 결합한 다중 생체인식 방법으로 벡터양자기를 이용한 정보융합방법을 제안하였다. 생체인식은 생체정보의 변별 한계로 인해 빠르고 정확한 인식을 하는 데 어려움이 있다. 이를 해결하기위해 본 논문은 세 가지의 주된 방법에 대해 연구하였다. 첫째, 화자인식에서 벡터양자기의 계산량을 감소시키는 방안을 연구하였다. 본 논문에서는 분류기 혹은 인식기로 사용되는 벡터 양자기에서 계산량을 감소시키기 위한 제약된 구조의 벡터양자기를 제안하였다. 그리고 이를 공간분할 벡터양자기라 명명하였다. 제안된 공간분할 벡터양자기는 신호가 존재하는 공간을 공간분할 코드북으로 적절히 분할한다. 그리고 분할된 공간에서의 신호원의 무게중심점인 최적 양자점을 코드북으로 생성한다. 이렇게 함으로써 학습시 반복 학습이 필요없게 되며 인식시에도 계산량의 감소를 가져온다. 둘째, 얼굴인식에서 새로운 얼굴 인식 방법으로 기존의 아이겐페이스 얼굴인식방법을 확장하여 얼굴의 변이를 수용하기위해 벡터 양자기를 적용한 주성분분석 벡터양자기 방법을 제안하였다.이 방법은 얼굴의 특징계수의 공간인 아이겐페이스 공간에서 각 얼굴의 특징 분포를 적절히 군집화함으로써 얼굴의 변이를 수용하고 인식률의 개선을 가져온다. 셋째, 단일 생체 인식 방법은 인식률과 안정성에서 한계를 가지게 된다. 이의 개선을 위해 본 논문에서는 얼굴과 음성의 결합을 통한 벡터 양자기 기반의 다중 생체 인식 시스템을 제안하였다. 제안된 시스템의 정보 융합 방법은 특징벡터 수준 정보 융합과 결정 수준 정보 융합 방법으로 구성되었다. 특징벡터 수준 정보융합은 음성과 얼굴로부터 얻어진 정보를 하나의 특징벡터로 생성하여 인식함으로써 단일 생체정보의 변별력보다 높은 변별력을 가질 수 있다. 또한 결정수준 정보융합은 각각의 벡터양자기를 독자적 인식기로 사용하여 인식된 결과를 논리합과 곱으로 평가한다. 이렇게 함으로써 각각의 인식 시스템의 단점을 상보적 보완하는 효과를 얻을 수 있는 장점이 생긴다. 논문의 주된 실험 결과는 다음과 같다. 첫째, 화자 인식 방법으로 공간 분할 벡터 양자기를 이용하여 문맥 독립 화자 인식 시스템과 문맥 종속 화자 인식 시스템을 구성 실험하였다. 학습 데이터와 코드북의 크기가 적절한 경우 인식률은 같게 나타나고 학습과 인식시간은 약 1/10으로 감소되었다. 둘째, 주성분분석 벡터양자기를 이용한 얼굴인식 시스템을 구성하고 기존의 아이겐페이스와 비교 실험하였다. 실험결과 기존 방법에 비해 모든 실험조건에 대해 약 10%의 인식률 개선이 있었다. 셋째, 벡터양자기기반의 다중생체인식시스템을 구성하고 단일 생체인식시스템과 비교 실험하였다. 실험결과, 특징벡터 수준 정보융합은 단일 생체 인식 방법에 비해 모든 실험 조건에 대해 인식률의 개선이 있었다. 또한 결정 수준 정보 융합 방법에서는 전반적으로 단일 시스템보다 안정적 인식률을 나타냄을 확인하였다. 본 논문에서 제안된 공간분할 벡터양자기와 주성분분석 벡터양자기 그리고 벡터 양자기 기반의 다중 생체인식 시스템 설계 방법은 실제 응용에 있어 계산량 감소, 인식률 증가, 안정성에 개선을 가지는 도구로 다양하게 응용될 것으로 사료된다.

more

초록/요약

This thesis is a study on a vector quantizer-based Biometrics that uses voice and face information. The author proposed a classified space vector quantizer which decreased computational complexity of training and recognizing procedure for speaker recognition. And proposed a principal component analysis vector quantizer which increased the discrimination among the faces in eigenspace for face recognition. And proposed a information fusion method which utilized the vector quantizer for multi-modal biometrics fusing face and voice. It was hard to make fast and precise recognition system by a discrimination limit of biometric information. For solving the problem, this thesis was devoted to study of three main method. Firstly, author researched the algorithm for reducing computational complexity of vector quantizer utilized for speaker recognition. For reducing the computational complexity, a constrained vector quantizer which was used as classifier or recognizer was proposed. We named this constrained vector quantizer the space classified vector quantizer. The proposed vector quantizer divides space of data into classified space codebook. And then the produced code vector is the centroid of a classified space. Therefore the proposed vector quantizer is not necessary to compute for iterative learning and decreases the computation complexity for recognition procedure. Secondly, for improving the discriminative ability on the variation of faces, a principal component analysis vector quantizer was proposed. The proposed novel algorithm is the extension of eigenface using vector quantization. This vector quantization make a cluster which represents the distribution of feature vectors in eigenspace, so that the proposed method accepts the variation of faces and make the improvement of recognition rate. Thirdly, the uni-modal biometric methods have the limitation on the stability of system and the ability of recognition. For solving the problem, we proposed multi-modal biometric systems using face and speech, which are based on vector quantizer. The proposed systems are made by the feature vector level information fusion and the decision level information fusion. The feature vector level information fusion has more discriminative ability by the unified feature vector obtained from face and voice than the uni-modal system of face or speech. Also, decision level information fusion recognizes the result of AND, OR decision obtained on the both vector quantizer of face and speech. Therefore, this system has an advantage, which mutually supplement a defect caused by noise of image and sound. The main results of the thesis are as follows. firstly, we made the experiments on speaker recognition using the classified space vector quantizer and the conventional vector quantizer. The systems had constructed by the speaker-dependent system and the speaker-independent system. When the recognition rate is equal, the classified space vector quantizer reduced the training and recognition time to one tenth compared with that of the conventional vector quantizer. Secondly, we made the experiments on face recognition using the principal component analysis vector quantization method and eigenface method. The experimental results show 10% improvement on the recognition rate for all conditions. Thirdly, we made the experiments on the multi-modal recognition using vector quantizer. In experimental results, the feature vector level information fusion had improvement on the recognition rate for all cases. And the decision level information fusion had the more stability than uni-modal system. In conclusion, the prosed methods have the reduced computational complexity, the improvements on the recognition rate, the enhanced stability. Therefore, the proposed vector quantizer-based biometric systems are useful in the implementations and the applications.

more

목차

차례
논문요약 = ⅰ
차례 = ⅲ
그림차례 = ⅵ
표차례 = ⅷ
약어표 = ⅸ
제 1 장 서론 = 1
1.1 논문의 개괄 = 1
1.2 화자인식에 관한 연구와 결과 = 2
1.3 얼굴인식에 관한 연구와 결과 = 4
1.4 다중 생체인식에 관한 연구와 결과 = 6
1.5 체제 개관 = 7
제 2 장 공간분할 벡터양자기 = 8
2.1 벡터양자기 = 8
2.1.1 기본 개념 = 8
2.1.2 왜곡척도 = 11
2.1.3 최적 양자기의 필요 조건 = 12
2.1.4 클러스터링 방법 = 16
2.1.5 제약된(constrained) 벡터양자기 = 19
2.1.6 무게중심 보로노이 테셀레이션 = 22
2.1.7 인식기 혹은 분류기로서의 벡터양자기 = 25
2.2 공간분할 벡터양자기 = 28
2.2.1 공간분할 벡터양자기의 개요 = 28
2.2.2 공간분할 벡터양자기의 설계 = 31
2.2.3 공간분할 벡터양자기의 성질 = 34
2.2.4 공간분할 벡터양자기의 계산량 = 35
제 3 장 화자인식 시스템 = 38
3.1 화자인식 시스템의 개요 = 38
3.2 화자의 특징 추출 = 42
3.2.1 개요 = 42
3.2.2 단구간 분석 = 42
3.2.3 특징 벡터 생성 방법 = 45
3.2.4 켑스트럼 분석 = 45
3.2.5 선형 예측 계수 = 51
3.3 패턴 정합과 화자 모델링 = 54
3.3.1 패턴 인식의 개요 = 54
3.3.2 Gaussian Mixture Model = 54
3.3.3 VQ 기반 화자 식별 = 56
3.4 공간분할 벡터양자기를 이용한 화자인식 시스템 = 59
3.4.1 공간분할 코드북 생성법 = 59
3.5 수치 실험 결과 = 65
3.5.1 문맥 종속 화자인식 시스템 = 65
3.5.2 문맥 독립 화자인식 시스템 = 69
제 4 장 얼굴인식 시스템 = 77
4.1 아이겐페이스를 이용한 얼굴인식 = 77
4.2 주성분분석 벡터양자기를 이용한 얼굴인식 = 83
4.2.1 아이겐페이스의 개선에 관한 기존연구 = 83
4.2.2 주성분 벡터양자기를 이용한 얼굴인식 = 84
4.3 수치 실험 및 결과 = 90
4.3.1 실험의 구성 = 90
4.3.2 결과 및 분석 = 92
제 5 장 다중 생체인식 시스템 = 94
5.1 정보융합의 개요 = 94
5.1.1 센서 데이터 수준 융합 = 95
5.1.2 특징 벡터 수준 융합 = 95
5.1.3 결정 융합 = 95
5.1.4 의견 융합 = 96
5.2 벡터양자기 기반 다중 생체인식 시스템 = 99
5.2.1 특징벡터 수준 융합 = 99
5.2.2 결정 융합 = 100
5.3 수치 실험 및 결과 = 104
5.3.1 실험의 구성 = 104
5.3.2 결과 및 분석 = 104
제 6 장 결론 = 109
참고문헌 = 111
Abstract = 120

more