複製鏈接
請複製以下鏈接發送給好友

語音增強

鎖定
語音增強是指當語音信號被各種各樣的噪聲干擾、甚至淹沒後,從噪聲背景中提取有用的語音信號,抑制、降低噪聲干擾的技術。一句話,從含噪語音中提取儘可能純淨的原始語音。
中文名
語音增強
外文名
speech enhancement
概    念
從噪音中提取純淨的原始語音
應用範圍
軍事通信、竊聽技術、語音識別
目    的
改進語音質量、提高語音可懂度
語音增強算法
噪聲對消法、諧波增強法等
正常噪聲環境
60dB聲級
應用學科
通信

目錄

語音增強定義

語音編碼和語音識別研究常常是在實驗室條件下進行的,也就是在信噪比很高或無噪聲的環境中進行的。因此當語音處理從實驗室走向實際應用時,由於實際環境噪聲與干擾的存在,會使許多方法無法使用,性能急速下降。因此研究對受噪降質語音改善其聽覺效果或提髙信噪比的處理,是面臨的必須解決的實際問題。
實際語音遇到的干擾可以分以下幾類:①週期性噪聲,例如電氣干擾,發動機旋轉部分引起的干擾等,這類干擾表現為一些離散的窄頻峯;②衝激噪聲,例如-些電火花、放電產生的噪聲干擾;③寬帶噪聲,這是指高斯噪聲或白噪聲一類的噪聲,它們的特點是頻帶寬,幾乎覆蓋整個語音頻帶;④語音干擾,例如話筒中拾入其它人的説話,或者傳輸時遇到串音引起的語音。對付上述各種不同類型的噪聲,增強技術亦是不一樣的。
週期性噪聲可以用濾波方法濾除,而設計的濾波器,在濾除干擾的同時應不產生影響語音可懂度的副作用。一般可以採用固定濾波器、自適應濾波器和傅里葉變換濾波器等。衝激噪聲可以通過相鄰的樣本值,採取內插方法將其除去,或者利用非線性濾波器濾除。寬帶噪聲是難以消除的一種干擾,因為它與語音具有相同的頻帶,在消除噪聲的同時將影響語音的質量,現在常用的方法有減譜法、自相關相減法、最大似然估計法、自適應抵消法,以及其它一些自適應技術。此外還可以利用一些試驗性能改善聽覺效果的經驗方法,這些方法是基於聽覺感知器官的某些特性來增強語音的。但是對於這類噪聲,儘管使用了很複雜的處理技術,改善的聽覺效果卻是有限的,只是不再十分吵人而已。語音噪聲的消除,也是很困難的,一般是利用不同説話人有不同基音頻率的特點,採用自適應技術跟蹤某説話人的基音,形成梳狀濾波器,這種方法對元音語音處理是顯著的,但是這是一件很費時的處理過程。
語音增強應用範圍很廣,對於處於特殊環境的語音系統,一般都要在不同程度上採取一些增強措施。例如直升機機艙內的通信語音處理、艦艇機艙內的通話系統等都需要用語音增強技術。

語音增強意義

1. 日常生活中,經常會遇到在噪聲干擾下進行語音通信的問題。例如在汽車、火車上使用移動電話,旁人的喧鬧聲,馬路旁和市場裏的公用電話等。
2. 軍事通信中,指揮員的作戰命令和戰鬥員的戰情彙報都需要用語音來表達,由於戰鬥環境中的聲環境惡劣,特別是炸彈產生的衝擊性噪聲,使有用信號完全淹沒在噪聲中。
(3)竊聽技術中需要語音增強。
(4)語音識別技術需要語音增強。
在實際生活中,語音信號無時無地不受各種噪聲干擾。人們正常的生活環境就是一個聲級為60dB左右的噪聲環境。被強噪聲污染的場合,噪聲達120dB以上。

語音增強目的

語音增強的一個主要目標是從帶噪語音信號中提取儘可能純淨的原始語音。然而,由於干擾通常都是隨機的,從帶噪語音中提取完全純淨的語音幾乎不可能。在這種情況下,語音增強的目的主要有兩個:一是改進語音質量,消除背景噪音,使聽者樂於接受,不感覺疲勞,這是一種主觀度量;二是,這是一種客觀度量。這兩個目的往往不能兼得。目前有一些對低信噪比帶噪語音進行語音增強的方法,可以顯著地降低背景噪聲,改進語音質量,但並不能提高語音的可懂度,甚至略有下降。

語音增強方法分類

常用的語音增強算法分為如下幾類:基於譜相減的語音增強算法、基於小波分析的語音增強算法、基於卡爾曼濾波的語音增強算法、基於信號子空間的增強方法、基於聽覺掩蔽效應的語音增強方法、基於獨立分量分析的語音增強方法、基於神經網絡的語音增強方法。這裏只是介紹一下各種語音增強方法流程,待確定方向之後再深入研究。
圖1:語音增強頻譜圖 圖1:語音增強頻譜圖
語音增強不但與語音信號數字處理理論有關,而且涉及到人的聽覺感知和語音學範疇。再者,噪聲的來源眾多,因應用場合而異,它們的特性也各不相同。所以必須針對不同噪聲,採用不同的語音增強對策。某些語音增強算法在實際應用中己經證明是有效的,它們大體上可分為四類:噪聲對消法、諧波增強法、基於參數估計的語音再合成法和基於語音短時譜估計的增強算法。