可控制語速的韻律訊息產生裝置及語速相依之階層式韻律模組 | 專利查詢

可控制語速的韻律訊息產生裝置及語速相依之階層式韻律模組


專利類型

發明

專利國別 (專利申請國家)

中華民國

專利申請案號

101133059

專利證號

I 503813

專利獲證名稱

可控制語速的韻律訊息產生裝置及語速相依之階層式韻律模組

專利所屬機關 (申請機關)

國立交通大學

獲證日期

2015/10/11

技術說明

本發明為一種可控制語速的韻律訊息產生方法,它可以依輸入的文字及指定的語速來產生適當的韻律參數,以合成自然流利的語音。它首先在訓練過程建立一個語速相依之階層式韻律模型,此模型包含12個子模型,用以描述各種韻律聲學參數和語言參數、韻律結構標記、語速之間的關係,它完整考慮了語速對於音長、音高軌跡、停頓時機、停頓出現頻率、停頓時長所造成的影響,此訓練過程採用了一個依序最佳化演算法;在語音合成階段,它使用此語速相依之階層式韻律模組,依輸入的文字及指定的語速來產生4 種韻律聲學參數,包括音節長度、音節基頻軌跡、音節能量為準、及停頓長度,使用這些韻律聲學參數可以合成流利自然的語音。本發明可應用於電子有聲書、手機、PDA及電腦等裝置上,作為將文字轉成語音的人機介面。 This invention is a speaking rate-controlled prosody generation method. It can generate prosodic information for synthesizing natural speech for any input text with designated speaking rate. It constructs a speaking rate-dependent hierarchical prosodic model (SR-HPM) in the training phase to describe various relationships among prosodic-acoustic features of speech signal, linguistic features of the associated text, prosodic tags representing a 4-layer prosody hierarchical structure, and speaking rate. It uses the SR-HPM in the speech synthesis phase to generate syllable duration, syllable pitch contour, syllable energy level, and pause duration for any input Chinese text with given speaking rate. The invention can be used in devices, such as e-book, smart phone, PDA and computer.

備註

連絡單位 (專責單位/部門名稱)

智慧財產權中心

連絡電話

03-5738251


版權所有 © 國家科學及技術委員會 National Science and Technology Council All Rights Reserved.
建議使用IE 11或以上版本瀏覽器,最佳瀏覽解析度為1024x768以上|政府網站資料開放宣告
主辦單位:國家科學及技術委員會 執行單位:台灣經濟研究院 網站維護:台灣經濟研究院