免费看片黄色-久久精品成人av-天天操天天爱天天爽-无码内射中文字幕岛国片-成人在线视频免费-国产一级一区-国产在线aaa-国产精品情侣-一区二视频-中文字幕亚洲无线码在线一区-日韩一区二区三区在线免费观看-久久精品二区-国产手机av片在线观看-免费看成人-男人的天堂影院-黄色片子视频-热久久中文字幕

公司新聞
行業(yè)新聞
AI智能語音模塊之AI智能語音合成技術

行業(yè)新聞|2023-08-21|YIPPEE

    語音合成是通過機械和電子方法產生人工語音的技術。一般來說,語音合成就是讓機器模仿人類說話。也就是說,輸入一段文字,后輸出一段聲音。

    語音合成是一個將文本轉化為語音的過程,類似于人類的嘴巴。目前,語音合成技術主要應用于地圖導航、語音助手、教育、娛樂等軟件應用,以及智能揚聲器、家用電器、機器人等硬件設備。

    AI智能語音模塊語音合成系統(tǒng)通常包括兩個模塊:前端和后端。前端模塊主要分析輸入文本,提取后端模塊所需的語言信息。對于中文合成系統(tǒng),前端模塊一般包括文本正則化、分詞、詞性預測、多音字消歧、節(jié)奏預測等子模塊。根據前端分析結果,后端模塊通過一定的方法生成語音波形。后端模塊一般分為兩條技術主線:基于統(tǒng)計參數建模的語音合成,基于單元選擇和波形拼接的語音合成。

    現(xiàn)階段的語音合成系統(tǒng)可以分為三種類型:1。參數語音合成系統(tǒng)。2.拼接語音合成系統(tǒng)。3.基于波形的統(tǒng)計合成系統(tǒng)。其中,參數語音合成系統(tǒng)和拼接語音合成系統(tǒng)是目前各大公司的主流在線合成系統(tǒng),基于波形的統(tǒng)計合成系統(tǒng)的方法還處于研究階段,是目前研究的熱點。

    1參數語音合成系統(tǒng)的特點是,在語音分析階段,語音波形需要通過聲碼器轉換為頻譜、基頻、時長等語音或節(jié)奏參數。在建模階段建模語音參數,在語音合成階段,時域語音信號由聲碼器預測的語音參數還原。參數語音合成系統(tǒng)的優(yōu)點是模型尺寸小,模型參數調整方便,合成語音相對穩(wěn)定。

    2、拼接語音合成系統(tǒng)的特點是將原始錄音剪切成基本單元存儲,而不是參數化原始錄音。在合成過程中,通過一些算法或模型計算每個單元的目標成本和連接成本,后通過Viterbi算法和PSOLA或WSOLA等信號處理方法“拼接”合成語音。因此,拼接語音合成的優(yōu)點是音質好,不受語音單元參數化音質的損失。但是,在數據庫小的情況下,合成語音韻需要穩(wěn)定,因為有時候選擇不到合適的語音單元。

    3、WaveNet波形統(tǒng)計語音合成的主要單元是卷積神經網絡。該方法的特點是使用神經網絡直接預測合成語音波形的每個采樣點,而不是參數化語音信號。優(yōu)點是音質比參數合成系統(tǒng)好,略差于拼接合成,但比拼接合成系統(tǒng)更穩(wěn)定。缺點是合成時間慢,因為需要預測每個采樣點。

清流县| 北流市| 乌恰县| 启东市| 柯坪县| 纳雍县| 鄂州市| 峨边| 鹤山市| 绥棱县| 二连浩特市| 陆丰市| 克东县| 汉沽区| 富平县| 咸宁市| 涞源县| 凤城市| 鸡东县| 梧州市| 武安市| 翁源县| 郯城县| 墨玉县| 黔南| 乌拉特前旗| 临城县| 兴安盟| 合水县| 揭西县| 长沙市| 临清市| 合阳县| 临汾市| 安丘市| 丹阳市| 廊坊市| 河曲县| 江油市| 彭山县| 屯门区|