學(xué)術(shù)不端文獻(xiàn)論文查重檢測(cè)系統(tǒng) 多語種 圖文 高校 期刊 職稱 查重 抄襲檢測(cè)系統(tǒng)
知網(wǎng)論文檢測(cè)入口,結(jié)果100%與學(xué)校一致!知網(wǎng)本科PMLC、研究生VIP5.1/TMLC2、職稱等論文查重檢測(cè)系統(tǒng)。可供高校知網(wǎng)檢測(cè)學(xué)位論文和已發(fā)表的論文,助您輕松通過高校本碩博畢業(yè)論文檢測(cè)。
在語音應(yīng)用中進(jìn)行語音的端點(diǎn)檢測(cè)是很必要的,首先很簡(jiǎn)單的一點(diǎn),就是在存儲(chǔ)或傳輸語音的場(chǎng)景下,從連續(xù)的語音流中分離出有效語音,可以 降低存儲(chǔ)或傳輸?shù)臄?shù)據(jù)量 。 其次是在有些應(yīng)用場(chǎng)景中,使用端點(diǎn)檢測(cè) 可以簡(jiǎn)化人機(jī)交互 ,比如在錄音的場(chǎng)景中,語音后端點(diǎn)檢測(cè)可以省略結(jié)束錄音的操作。 為了能更清楚說明端點(diǎn)檢測(cè)的原理,先來分析一段音頻。 上圖是一段只有兩個(gè)字的簡(jiǎn)單音頻,從圖上可以很直觀的看出,首尾的靜音部分聲波的振幅很小,而有效語音部分的振幅比較大,一個(gè)信號(hào)的振幅從直觀上表示了信號(hào)能量的大小:靜音部分能量值較小,有效語音部分的能量值較大。 語音信號(hào)是一個(gè)以時(shí)間為自變量的一維連續(xù)函數(shù) ,計(jì)算機(jī)處理的語音數(shù)據(jù)是語音信號(hào)按時(shí)間排序的采樣值序列,這些采樣值的大小同樣表示了語音信號(hào)在采樣點(diǎn)處的能量。
在大段的語音聽寫應(yīng)用中,由于中間會(huì)出現(xiàn)逗號(hào)或句號(hào)等較長時(shí)間的停頓,宜將端點(diǎn)檢測(cè)的靈敏度降低,此時(shí)M0值設(shè)置為較大值,對(duì)應(yīng)的音頻時(shí)長一般為1500-3000毫秒。 所以M0的值,也就是端點(diǎn)檢測(cè)的靈敏度,在實(shí)際中應(yīng)該做成可調(diào)整的,它的取值要根據(jù)語音應(yīng)用的場(chǎng)景來選擇。
端點(diǎn):靜音和有效語音信號(hào)變化臨界點(diǎn)。 在實(shí)際應(yīng)用中,比如說電話通話時(shí),用戶沒有講話時(shí),就沒有語音分組的發(fā)送,從而可以進(jìn)一步降低語音比特率。 當(dāng)用戶的語音信號(hào)能量低于一定門限值時(shí)就認(rèn)為是靜默狀態(tài),也不發(fā)送語音分組。