검색 상세

음성 기반의 음악 검색을 위한 음성 신호 변환 기법

A Voice Signal Transformation Scheme for Voice-based Music Retrieval

초록/요약

많은 음악 검색 시스템에서 검색의 효율성을 위해 MIDI와 같은 데이터 형식을 사용한다. 질의의 경우 사용자의 육성이나 허밍(humming)을 분석하여 음의 정보를 추출하고, 그 정보를 데이터베이스에 저장되어 있는 음악 MIDI 파일과 스트링 매칭과 같은 연산을 통해 검색하게 된다. 이런 경우 마이크를 통해 전달되는 음성 신호를 MIDI 형태로 실시간으로 정확하게 변환하는 것이 필수적이다. 본 논문에서는 음성 신호를 MIDI로 변환하기 위한 새로운 음성 질의 변환 기법을 제안한다. 제안하는 기법을 통하여 피치 검출을 위해 기존에 알려진 음성분석에 적합한 자기 상관함수를 이용함으로써 정확성을 높였고, 시간 영역에서 분석이 이루어지는 특징으로 인해 연산 시간을 줄일 수 있었다. 또한 보다 정확한 음의 길이 정보를 알아내기 위해 ADF를 통한 음의 시작 정보를 활용함으로써 분석 성능의 향상을 가져올 수 있었다. 이러한 기법은 단순히 콧노래 등 단음을 이용한 허밍뿐만 아니라 가사를 이용한 허밍에도 높은 정확성을 가지고 적용할 수 있음을 실험을 통하여 검증하였다.

more

초록/요약

Many content-based music retrieval systems represent musicusing the MIDI format to improve the retrieval efficiency. In such systems, voice queries such as humming need to be transcribed into MIDI note to find out any matched music from database.In this paper,we presentan ADF-based voice query processing system that transforms original voice signal into MIDI format. To perform the transformation, a sequence of pitch and duration pairs are extracted from the original voice signal. The pitch is tracked by an autocorrelation function, which is frequently used in the pitch an alysisin time-domain. For the exactduration detection,we propose a novel algorithm that combines the onset detection method using ADF and pitch tracking-based duration detection method. In order to estimate the accuracy of the transformation,we tested various queries on the prototype retrieval system and report some of the results.

more

목차

목차
1장 서론 = 1
2장 관련연구 = 4
2.1절 시간영역에서의 특성 추출 = 4
2.2절 주파수영역에서의 특성 추출 = 6
3장 음성질의 처리 = 8
3.1절 전처리 = 8
3.2절 무음구간 검출 = 10
3.3절 ADF를 이용한 음의 시작 지점 검출 = 10
3.4절 피치 검출 = 13
4장 질의 표현 = 15
5장 구현 및 실험 결과 = 17
6장 결론 및 향후 연구 = 22
7장 참고문헌 = 23
ABSTRACT = 26

more