發明
中華民國
101136364
I 470387
無線語音控制系統
國立高雄大學
2015/01/21
本專利之範疇包含一用於提升語音辨識率之方法、一用於提升語音抗雜訊能力之方法,以及一利用嵌入式FPGA平台實現智慧型家庭控制系統。在用於提升語音辨識率之方法部分,主要可區分為語音模型訓練與語音辨識兩個步驟。在語音模型訓練步驟中,以模糊向量量化(Fuzzy Vector Quantization, FVQ)方式建立離散隱藏式馬可夫模型(DHMM),並將結果用來做為語音模型之建立與訓練。在語音的辨識步驟中,把輸入語音特徵向量做模糊向量量化,並將模糊向量量化後的觀察結果代入訓練後的語音模型,以達成較高的語音辨識效果。在用於語音抗雜訊能力之方法部分,採用中研院黃鍔院士的經驗模態分解法(Empirical Mode Decomposition, EMD),將含雜訊的語音訊號分解成多組本質模態函式(Intrinsic Mode Function, IMF),再以實數型基因演算法(GA)找出最佳IMF組合參數,並將分離出之IMF依組合參數還原成語音,以達到語音抗雜訊的能力。然而,在智慧型家庭控制系統之實際應用上則是將語音辨識系統和語音抗雜訊系統加到嵌入式FPGA平台,並在FPGA平台上加入無線發射模組。再將清潔機器人加入無線接收模組,即可以用FPGA平台在有噪音的環境中控制清潔機器人。 An FPGA-based robust speech recognition system which is subject to environmental noise is designed in this patent to control a home service robot wirelessly. The empirical mode decomposition (EMD) is used to decompose the measured speech signal contaminated by environmental noise into several intrinsic mode functions (IMFs). Then, the IMFs are weighted and summed to reconstruct the original clean speech signal. Unlike the previous research, in which IMFs are selected by trial and error for some specific applications, the weight for each IMF is designed by genetic algorithm (GA) in this patent to obtain an optimal solution. The fuzzy vector quantization (FVQ) on the modeling of DHMM to improve the speech recognition rates. Finally, combining a wireless module, the FPGA-based speech recognition system is used to control the motions of a home service robot wirelessly via speech commands under some environmental noises.
依111.12.20.本會111年第4次研發成果管理審查會決議辦理 本會(收文號1110047863)同意該校111年7月26日高大研發字第1111400173號函申請終止維護專利(國立高雄大學)
研究發展處
07-5919100
版權所有 © 國家科學及技術委員會 National Science and Technology Council All Rights Reserved.
建議使用IE 11或以上版本瀏覽器,最佳瀏覽解析度為1024x768以上|政府網站資料開放宣告
主辦單位:國家科學及技術委員會 執行單位:台灣經濟研究院 網站維護:台灣經濟研究院