数理情報第3研輪講

日時
2010年4月20日(火), 17:15〜19:00.
場所
東京大学 工学部6号館 235号室.
講演者
井町 宏人 (M1)
題目
拍特徴抽出と倍音抑圧を用いた音楽音響信号からの和音認識の研究(研究紹介)
概要

本研究では、音楽音響信号からの自動和音認識を行う。認識手法として、和音進行を音響特徴量を出力とし和音を隠れ状態とする隠れマルコフモデルを用いてモデル化し、最尤推定により和音系列を推定するというShehら[1]の手法を取るが、このモデルを利用するためには音楽音響信号から適切な音響特徴量を抽出する必要がある。本研究では、以下の2つのアプローチを用い、音響特徴量の抽出法の改善によって和音認識性能を向上させることを目指す。
和音境界の推定精度の向上のため、調波音打楽器音分離[2]を利用して抽出した打楽器音特徴量と、各和音複数状態のモデルを用いることを提案し、実験によって性能が向上したことを示す。また、倍音の影響による和音認識誤りを改善するため、Harmonic Non-negative Matrix Factorization[3]によってあらかじめ倍音を抑圧したクロマベクトル特徴量を提案し、手法の有効性を検証する。

参考文献

[1]Alexander Sheh and Daniel P. W. Ellis: Chord segmentation and recognition using em-trained hidden markov models. In Proceedings of the International Symposium on Music Information Retrieval Baltimore, pp. 183-189, 2003.
[2]Nobutaka Ono, Kenichi Miyamoto, Jonathan Le Roux, Hirokazu Kameoka, and Shigeki Sagayama: Separation of a monaural audio signal into harmonic/percussive components by complementary diffusion on spectrogram. In Proceedings of EU-SIPCO, 2008.
[3]Stanis law A. Raczynski, Nobutaka Ono, and Shigeki Sagayama: Multipitch analysis with harmonic nonnegative matrix approximation. In Proceedeings of the 2007 ISMIR, pp. 381-386, 2007.

3研輪講スケジュールへ

3研のホームページへ