發明
中華民國
107107207
I 691955
多通道之多重音頻串流方法以及使用該方法之系統
國立中央大學
2020/04/21
基礎頻率分析在數位訊號處理中是一項重要課題並可以延伸到許多相關的研究,無論是在音樂或者語音上皆有其中要性,本系統主要討論多個單音音源的音高分類方法,本研究提出之系統需要三個輸入,分別為音源個數、基頻偵測結果、混合音檔。而整體系統可以分為兩個階段,第一階段為依據基頻偵測結果將每一個音高取得相對應特徵參數,第二階段則將上述所有資料進行的聚類,最後輸出各個音源的MIDI檔案,簡單來說即是每個時刻每個音源演奏哪些音高的資訊。本系統在特徵參數方面我提出了新的多通道方位特徵參數,並與其他音色特徵參數融合成為更加強健的特徵參數,聚類方面我們基於粒子群最佳化演算法提出了新的架構,並融合領域知識於其中來提高準確率。另外本系統特別針對音源音域接近的音檔來設計並能有更好的準確率。 In this research, we discuss the multipitch streaming (MPS) problem on the mixture data which sources have interweaving pitch contours. We propose two approaches to tackle this challenge. One considers features extracted from the energy levels distributed in multi-channel recordings for better characterization of the source, and the other using particle swarm optimization (PSO) to enlarge the search space and alleviate the initialization problem in the constrained clustering of the features representing different source. Experiments on music and speech samples having highly interweaving pitch contours are presented to access its effectiveness.
智權技轉組
03-4227151轉27076
版權所有 © 國家科學及技術委員會 National Science and Technology Council All Rights Reserved.
建議使用IE 11或以上版本瀏覽器,最佳瀏覽解析度為1024x768以上|政府網站資料開放宣告
主辦單位:國家科學及技術委員會 執行單位:台灣經濟研究院 網站維護:台灣經濟研究院