DOI QR코드

DOI QR Code

The Noise Robust Algorithm to Detect the Starting Point of Music for Content Based Music Retrieval System

노이즈에 강인한 음악 시작점 검출 알고리즘

  • 김정수 (숭실대학교 IT대학 미디어학과) ;
  • 성보경 (숭실대학교 IT대학 미디어학과) ;
  • 구광효 (숭실대학교 IT대학 미디어학과) ;
  • 고일주 (숭실대학교 IT대학 미디어학과)
  • Published : 2009.09.30

Abstract

This paper proposes the noise robust algorithm to detect the starting point of music. Detection of starting point of music is necessary to solve computational-waste problem and retrieval-comparison problem with inconsistent input data in music content based retrieval system. In particular, such detection is even more necessary in time sequential retrieval method that compares data in the sequential order of time in contents based music retrieval system. Whereas it has the long point that the retrieval is fast since it executes simple comparison in the order of time, time sequential retrieval method has the short point that data starting time to be compared should be the same. However, digitalized music cannot guarantee the equity of starting time by bit rate conversion. Therefore, this paper ensured that recognition rate shall not decrease even while executing high speed retrieval by applying time sequential retrieval method through detection of music starting point in the pre-processing stage of retrieval. Starting point detection used minimum wave model that can detect effective sound, and for strength against noise, the noises existing in mute sound were swapped. The proposed algorithm was confirmed to produce about 38% more excellent performance than the results to which starting point detection was not applied, and was verified for the strength against noise.

본 논문에서는 노이즈에 강인한 음악 시작점 검출 알고리즘을 제안한다. 음악의 시작점 검출은 음악을 이용한 신호처리 시스템에 있어서 일관되지 않은 입력데이터를 통한 계산낭비, 비교검색 등의 문제 해결을 위해 필요한 것이다. 특히 신호처리를 이용한 내용기반 음악검색 시스템에서 시간의 순서로 데이터를 비교하는 시간순차적 검색방법에서는 더욱 필요시 된다. 시간순차적 검색 방법은 시간의 순서로 단순 비교를 수행하기 때문에 검색의 속도가 빠르다는 장점이 있는 반면 비교하는 데이터의 시작 시간이 동일해야 하는 단점이 있다. 하지만 디지털화된 음악은 비트레이트 변환에 의한 시작 시간의 동일함을 보장할 수 없다. 따라서 본 논문에서는 검색의 전처리 단계에서 음악의 시작점을 검출함으로써 시간순차적 검색 방법을 적용하여 고속의 검색을 수행하면서도 인식률이 낮아지지 않게 하였다. 시작점 검출은 소리를 검출할 수 있는 최소 파형모형을 이용하였으며 노이즈에 강인하기 위하여 묵음에 존재하는 노이즈는 스킵핑을 하였다. 제안한 알고리즘은 실험을 통해 시작점 검출을 미적용한 결과보다 약 38% 성능이 향상됨을 확인하였으며 노이즈에 강인함을 검증하였다.

Keywords

References

  1. 정명범, 성보경, 고일주, "내용 기반 음악 검색의 문제점 해결을 위한 전처리," 한국컴퓨터정보학회논문지, 제 12권, 제 6호, 97-104쪽, 2007년 12월.
  2. B.-K. Yi, H.V. Jagadish, and C. Faloutsos, "Efficient Retrieval of Similar Time Sequences under Time Warping," In Proceedings of ICDE, pp.201-208, February 1998.
  3. J. Listgarten, R. M. Neal, S. T. Roweis, and A. Emili, "Multiple alignment of continuous time series," In Advances in Neural Information Processing Systems 17, pp.817-824, 2005.
  4. 이혜환, 심규석, 박형민, "HummingBird: 향상된 스케일드앤워프트 매칭을 이용한 유사 음악 검색 시스템," 한국정보과학회논문지, 제 34권, 제 5호, 409-419쪽, 2007년 10월.
  5. A.W.Fu, E.J.Keogh, L.Y.H.Lau and C. Ratanamahatana "Scaling and Time Warping in Time Series Querying," In Proc. of the VLDB Conference, pp.649-660, 2005.
  6. Waiyawuth Euachongprasit and Chotirat Ratanamahatana, "Accurate and efficient retrieval of multimedia time series data under uniform scaling and time warping," pp.100-111, 2008.
  7. Dixon, S., Widmer, G., "MATCH: a music alignment tool chest," Proceedings of the International Conference of Music Information Retrieval, pp.492-497, 2005.
  8. M. M. Ruxanda and C. S. Jensen, "Efficient similarity retrieval in music databases," In Proc. of COMAD, pp.56-67, 2006.
  9. Shannon B.J., Paliql K.K., "A comparative study offilterbank spacing for speech recognition," Proc. International Microelectronic engineering research conference, Brisbane, Austria, 2003.
  10. F. Zheng, G. Zhang, "Integrating the energy information into MFCC," Proc. International Conference of Spoken Language Processing, Beijing, China, 2000.
  11. Z. Jun, S. Kwong, W. Gang, Q.Hong, "Using Mel-Frequency Cepstral Coefficients in Missing Data Technique," EURASIP Journal on Applied Signal Processing, pp.340-346, 2004.
  12. 양병곤, "인간의 청각 척도에 관한 고찰," 음성과학, 제 2권, 125-134쪽, 1997년.