複製鏈接
請複製以下鏈接發送給好友

基音週期

鎖定
基音週期是一種用於記錄基音的時間波長的檢測方法。基音週期是機械波一個完整波長的時間。 [1] 
中文名
基音週期
外文名
fundamental tone period
性    質
週期波長

基音週期相關應用

語音是語言的口語形式,語言是人類交流信息最自然、最有效、最方便的手段。在高度信息化的今天,用現代手段研究語音處理技術,使人們能更加有效地產生、傳輸、存儲、獲取和應用語音信息,這對於促進社會的發展具有十分重要的意義。
語音信號分析是語音信號處理的前提和基礎,只有分析出可表徵語音信號本質特徵的參數,才有可能利用這些參數進行高效的語音合成、語音識別、語音壓縮編碼等處理,其中基音週期是最重要的語音信號的特徵參數之一 。

基音週期定義

人在發濁音時,氣流通過聲門,產生一股準週期脈衝氣流,這一氣流激勵聲道就產生濁音,又稱有聲語音,它攜帶着語音中的大部分機械波能量。這種機械波的波長稱為基波,相應的週期就稱為基音週期。
基音週期的估計稱為基音檢測 (fundamental tone detection),基音檢測的最終目標是畫出和波長完全一致的基音週期變化軌跡曲線,如不可能則儘量找出相吻合的軌跡曲線。
在語音信號處理中,語音信號參數提取的準確性非常重要。只有獲得準確的參數,才能利用這些參數進行高效的處理,而在許多參數提取中,基音週期的提取尤為重要,廣泛地應用於語音壓縮編碼、語音分析合成以及語音識別等方面,所以,準確可靠地估計並提取基音週期對語音信號處理至關重要 。它直接影響到合成語音是否真實再現原始語音信號,影響到語音識別的識別率,影響到語音壓縮編碼的正確率。

基音週期檢測因素

由於聲道的易變性及聲道特徵因人而異,而基音的範圍又很寬,即使是同一個人在不同時間下發音的基音週期也不同,加之基音週期還受到單詞發音音調的影響,因而基音週期的精確檢測實際上是一件比較困難的事情,基音提取的主要困難反映在 :
(1)語音信號變化十分複雜,聲門激勵的波形並不是一個完全的週期序列。在語音的頭尾部並不具有那樣的週期性,對有些清濁音的過渡幀很難判定它屬於週期性還是非週期性,從而對估計基音週期帶來一定的影響。
(2)從語音信號中去除聲道的影響,直接取出有關的聲源信息並非易事。如聲道共振峯可能強烈改變聲門波形的結構,從而嚴重影響激勵信號的諧波結構,會給基音檢測造成困難。
(3)語音信號是準週期的,且共振峯結構和噪聲有時會影響波峯位置,很難準確定位基音週期的開始和結束。
(4)區分清音語音和低電平濁音段是導致基音檢測困難的另一個重要因素。在許多情況下,清音語音與低電平濁音段之間的過度段是非常細微的,確認它是極其困難的。
(5)在實際應用中,背景噪聲強烈影響基音檢測的性能。
(6)基音週期變化範圍較大,從2ms到10ms,接近五倍,這也給基音週期的檢測帶來了一定的困難。另外,濁音信號可能包括很多諧波分量,而基波分量往往不是最強的分量,這些諧波成分疊加在一起,使語音信號的波形變得很複雜,給基音檢測帶來困難,經常發生基波估計結果比實際基音波長短很多。
由於這些困難,儘管基音提取的方法很多,但迄今尚未找到一個完善的方法可以對各類人羣(包括不同語種)和各種環境條件情況下都能獲得滿意的檢測結果。

基音週期研究現狀

儘管基音週期檢測有許多困難,但因為它的重要性,基音週期檢測一直是一個研究的重要課題。為了從語音波形中準確地提取基音的工作,使全世界的科學家忙了幾十年,從20世紀60年代以來出現了很多種基音週期檢測方法,特別是在有噪環境下的語音信號的基音週期檢測方面更是提出了許多有效的方法。進行基音檢測方面早期研究工作的國家主要有美國等歐美國家,之後,我國在基音檢測方面,尤其是對漢語的基音檢測工作也取得了很大進展。

基音週期檢測方法

為了提高基音檢測的準確性,降低計算複雜度,人們已經從基於時間的檢測方法和非基於時間的檢測方法出發 ,開發了許多基音檢測算法 。
按照是否基於時間分為:
(1)非基於時間的基音週期檢測方法
非基於時間的方法一般都先將語音信號分為長度一定的語音幀,然後對每一幀語音求平均基音週期,相比基於時間的基音週期檢測方法來説,它的優點是比較簡單,主要應用於只需要平均基音週期作為參數的語音編解碼,語音識別。這些方法有:自相關函數法 、平均幅度差函數法 和倒譜方法 。
傳統的自相關函數法(ACF)是Ross等人於1977年提出的 ,自相關函數法的原理是週期信號的自相關函數將在時延等於函數週期的地方產生一個極大值,因此通過計算語音信號的自相關函數可以估計信號的基音。自相關函數方法適合於噪聲環境下,但單獨使用經常發生基波估計結果為其實際基音波長的二分之一波長或二倍波長的情況;
傳統的平均幅度差函數法(AMDF)是Ross等人於1974年提出的 ,平均幅度差函數法無需乘法運算,因而算法複雜度小。倒譜法是由Noll等人於1967年提出的 ,這種算法的優點是對純淨語音的基音檢測精度較高,可以較好地從語音信號中分離出基音信息和聲道信息,缺點是算法比較複雜。
平均幅度差法、倒譜法在靜音環境下或噪聲較小時都可以取得較好的檢測結果,但在語音環境較惡劣、信噪比較低時,檢測的結果下降較快,難以讓人滿意 。基於此,本文提出了一種抗噪性很好的自相關能量函數(ACEF)和幅度差能量函數(MDEF)相結合的基音週期檢測算法,這種方法有效彌補了傳統基音週期檢測算法的缺點,它繼承了自相關函數的抗噪性能,抑制了自相關函數不必要的峯值,進一步加重了用於基音週期判斷的基音峯值點,提高了基音週期提取的準確性。
然而,由於非基於時間的基音週期檢測方法都是建立在語音信號在一幀內是短時平穩的基礎上的,因此,從本質上説,這些方法都無法檢測幀內的基音週期的非平穩變化,檢測精度不高,對於需要檢測出一幀內每一個基音峯值點的語音合成系統來説,無法得到很好的效果。於是需要能夠檢測出一幀內每一個基音峯值點的基於時間的基音週期檢測方法。
(2)基於時間的基音週期檢測方法
相比非基於時間的基音週期檢測方法而言,基於時間的基音週期檢測方法並不多見,如:小波變換方法 和Hilbert-Huang變換方法 ,這兩種方法都具有跟蹤基音週期變化的能力,能將微小的週期變化檢測出來。
小波變換在時域和波長域都具有良好的局部性特性,它是一種信號的時間-尺度分析方法,具有多分辨分析的特點,能有效的從信號中提取信息。小波就像一種共軛鏡象濾波器,每一次變換,就是把信號分成短波和長波分量,如果對變換後的長波分量再進行變換,得到的將是更為長波的分量,逐次進行下去,就可以得到去除了高次短波諧波,保留了基波的成分的長波分量,這樣就得到近似於只有基波成分的波形,因此可以在時域上得到所有的基音峯值點。
按照具體檢測方法
從具體檢測方法上來看,大致可以分為三類:
(1)波形估計法。直接有聲音波形來估計基音週期,分析出波形上的週期峯值。包括並行處理法、數據減少法等。
(2)相關處理法。這種方法在語音信號處理中廣泛使用,這是因為相關處理法抗波形的相位失真能力強,另外它在硬件處理上結構簡單。包括波形自相關法、平均幅值差分函數法(AMDF)、簡化逆濾波法(SIFT)等。
(3)變換法。將語音信號變換到波長域或者倒譜域來估計基音週期,利用同態分析方法將聲道的影響消除,得到屬於激勵部分的信息,進一步求取基音週期,比如倒譜法。雖然倒譜法分析算法比較複雜,但是基音週期估計效果好。
參考資料
  • 1.    李剛.科學術語:機械工業出版社,1990