Computer Speech and Language Lessons PPT PDF

單元五電腦語音與語言 ( 一 ) 目錄語音與語言智能簡介語言學知識文字轉語音系統的評估語音與智能處理人類語言的能力，被視為是一種具備智能的象徵能夠理解語音及生成語音的技術，是人工智能核心技術之一語音合成，也稱為文字轉語音 (TTS) ，接受文字輸入並生成語音輸出。活動一︰語音...

單元五電腦語音與語言 ( 一 ) 目錄語音與語言智能簡介語言學知識文字轉語音系統的評估語音與智能處理人類語言的能力，被視為是一種具備智能的象徵能夠理解語音及生成語音的技術，是人工智能核心技術之一語音合成，也稱為文字轉語音 (TTS) ，接受文字輸入並生成語音輸出。活動一︰語音特性語音包含豐富的資訊 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 活動一︰語音特性語音包含豐富的資訊 1. 意思 2. 意圖 3. 口音 4. 年齡 5. 態度 6. 教育程度 7. 情緒 8. 性別 9. 健康狀況 10. 語言能力 11. 個性活動二︰文字轉語音的日常應用例子活動二︰請列出兩個文字轉語音的日常應用例子例子一例子二例子三例子四活動二︰文字轉語音的日常應用例子活動二︰請列出兩個文字轉語音的日常應用例子例子一例子二例子三例子四對於視力有問題的人，有言語障礙的人可以使自動廣播系統學習新語言時機器能機器可以讀出文字以用機器生成自然的語音夠製作音頻發音以作供收聽參考 7 Linguistic Hierarchy 句子 “ 我愛香港” 我愛香港文字到語音合成系統語法代語動語名詞的設計從有關語言學我階層的語言知識中汲詞語 / 短語愛取靈感香港音素 aɪ lʌv hɔŋ kɔŋ 原聲 Process of Text-to-Speech Synthesis 接受文字輸入文字分析波形成生輸入例子︰文字規範化輸出︰ “ I am the 文字轉音位合成的語音 1st” 韻律預測 Text Analysis: Text Normalisation 文字規範化︰書面文字被轉換為「可朗讀」的詞 “I am the 1st” “I am the first” Text Analysis: Text-to-Phoneme Mapping 文字轉音位︰單詞被轉換為語音標籤 “I am the first” “/aɪ/ /æm/ /ðə/ /fɜrst/” Text Analysis: Prosody Prediction 韻律預測︰預測句子的特徵特徵︰語調、時間長度和能量（即聲量） “I am the first” 是問疑問句是否語調上升語調下降 I am the first? I am the first. Waveform Generation 波形生成︰語言表示轉換為波形語調下降 “/aɪ/ /æm/ /ðə/ /fɜrst/” I am the first. 合成的語音 Tr 人工智能 ning TTS 的 IPO 過程 Testing 使用已訓練的模型 M* 進行 TTS 的測試過程 TTS Evaluation 主觀測量計算合成語音波形和相應的人類語音比較受到各種因素所影響的意見分數波形之間的數學距離例如平均意見分數（ MOS ）距離越短，質量越好學習總結文字轉語音 (TTS) 的功能是接受文文字轉語音涉及文字分析及波形生成。字輸入，並生成合成語音輸出。使用文字轉語音科技的目標是令機文字轉語音系統生成的合成語音可器「說話」清晰、自然、富有表現以用客觀和主觀測量作評估。力，能夠像人類一樣有效地交流。文字轉語音系統通常參考人類口語的語言結構，遵循從高至低的語言階層的語音結構，包括句子、語法、詞語／短語、音素和原聲。

Computer Speech and Language Lessons PPT PDF

Document Details

Tags

Related

Summary

Full Transcript