發明
中華民國
101124882
I 584269
非監督式語者轉換偵測方法
國立中央大學
2017/05/21
語音切割的目的是將聲音切成多個分段,而每一個分段都只包含單一語者,可作為許多語音應用的前處理,而傳統的方法主要測試相鄰音窗之間的相似度,通常用生成式模型建立相鄰音窗的語者聲學模型,測量語者模型的相似度,而這裡我們提出一個新的概念,將傳統語音切割轉換成語者驗證問題,加入由大量語者所建立的反模型,加強相似度的可靠度。而為解決訓練的資料不足問題,因此採用支持向量機作模型的訓練,由於支持向量機需要耗費較多的訓練時間,因此我們先用較簡單的廣義概似比例作為第一階段找出可能的轉換點,第二階段再由我們提出的支持向量機相鄰音窗相似度演算法作確認,藉此減少運算時間並達到較好的偵測準確率。 The invention proposed a new method that turn traditional speaker change detection problem into model verification problem.
智權技轉組
03-4227151轉27076
版權所有 © 國家科學及技術委員會 National Science and Technology Council All Rights Reserved.
建議使用IE 11或以上版本瀏覽器,最佳瀏覽解析度為1024x768以上|政府網站資料開放宣告
主辦單位:國家科學及技術委員會 執行單位:台灣經濟研究院 網站維護:台灣經濟研究院