複製鏈接
請複製以下鏈接發送給好友

WAV

鎖定
WAV是最常見的聲音文件格式之一,是微軟公司專門為Windows開發的一種標準數字音頻文件,該文件能記錄各種單聲道立體聲的聲音信息,並能保證聲音不失真。但WAV文件有一個致命的缺點,就是它所佔用的磁盤空間太大(每分鐘的音樂大約需要12兆磁盤空間)。它符合資源互換文件格式(RIFF)規範,用於保存Windows平台的音頻信息資源,被Windows平台及其應用程序所廣泛支持。Wave格式支持MSADPCM、CCITT A律、CCITT μ律和其他壓縮算法,支持多種音頻位數、採樣頻率和聲道,是PC機上最為流行的聲音文件格式;但其文件尺寸較大,多用於存儲簡短的聲音片段。 [1] 
中文名
波形聲音文件
外文名
WAV
研發公司
Microsoft
實    質
一種標準數字音頻文件
特    點
真實記錄自然聲波形等
擴展名
.wav
所屬學科
計算機科學技術

WAV簡述

WAV文件是在PC機平台上很常見的、最經典的多媒體音頻文件,最早於1991年8月出現在Windows3.1操作系統上,文件擴展名為WAV,是WaveForm的簡寫,也稱為波形文件,可直接存儲聲音波形,還原的波形曲線十分逼真。WAV文件格式簡稱WAV格式是一種存儲聲音波形的數字音頻格式,是由微軟公司和IBM聯合設計的,經過了多次修訂,可用於Windows,MacintoshLinux等多種操作系統。WAV支持多種音頻數字、取樣頻率和聲道,標準格式化的WAV文件和CD格式一樣,也是44.1kHz的取樣頻率,16位量化數字,因此聲音文件質量和CD相差無幾。WAV的特點如下:真實記錄自然聲波形,基本無數據壓縮,數據量大。 [2] 
一般來説,由WAV文件還原而成的聲音的音質取決於聲音卡採樣樣本的尺寸,採樣頻率越高,音質就越好,但開銷就越大,WAV文件也就越大,

WAV存儲過程

聲源發出的聲波通過話筒被轉換成連續變化的電信號,經過放大、抗混疊濾波後,按固定的頻率進行採樣,每個樣本是在一個採樣週期內檢測到的電信號幅度值;接下來將其由模擬電信號量化為由二進制數表示的積分值;最後編碼並存儲為音頻流數據。有的應用為了節省存儲空間,存儲前,還要對採樣數據先進行壓縮。 [2] 

WAV文件結構

在Windows環境下,大部分多媒體文件都是按照資源互換文件格式(Resources lnterchange File Format)存放信息,簡稱RIFF格式。構成RIFF文件的基本單位稱之為塊(chunk)。每個RIFF文檔是由若干個塊構成。每個塊(chunk)由塊標識、塊長度及數據等三部分所組成。
其中,塊標識保存的是由4個ASCII碼字符組成的塊名字。如不滿4個字符則在右邊以空格充填。塊長度字段,
表1 WAV文件結構
RIFF塊
文件格式類型“WAVE”
fmt塊
fact 塊(壓縮編碼格式要含有該塊)
data塊
佔4個字節,保存的是當前塊數據的長度,不包括塊標識和塊長度字段。所以一個塊的實際長度為塊長度字段內的數值加8。RIFF格式規定,只有RIFF及LIST塊可以含有子塊,其它的塊不允許包含子塊。一個RIFF格式文檔本身就是一個塊。其前4個字節為文檔標識“RIFF”,同時也是RIFF的塊標識,標明該文檔是一個有效的RIFF文檔;第二部分為文件的數據長度,佔4個字節,其數值為文件長度-8;第三部分為RIFF塊數據,其中,前4個字節為文件格式類型標識,如:“WAVE”,“AVI”等,後面其它部分為RIFF塊的子塊。
WAV文件採用的是RIFF格式結構。至少是由3個塊構成,分別是RIFF、fmt 和Data。所有基於壓縮編碼的WAV文件必須含有fact塊。此外所有其它塊都是可選的。塊mt,Data及fact均為RIFF塊的子塊。WAV文件的文件格式類型標識符為“WAVE”。基本結構如表1。 [2] 

WAV編碼

編碼包括了兩方面內容,一是按一定格式存儲數據,二是採用一定的算法壓縮數據。WAV格式對音頻流的編碼沒有硬性規定,支持非壓縮的PCM(Puls Code Modulation)脈衝編碼調製格式,還支持壓縮型的微軟自適應差分脈衝編碼調製Microsoft ADPCM(Adaptive Differential Puls Code Modulation)、國際電報聯盟(International Telegraph Union)制定的語音壓縮標準ITU G.711a-law、ITU G.711-law、IMA ADPCM、ITU G.723ADPCM(Yamaha)、GSM 6.10、ITU G.721 ADPCM編碼和其它壓縮算法。MP3編碼同樣也可以運用在WAV中,只要安裝相應的Decode,就可以播放WAV中的MP3音樂。
PCM編碼是直接存儲聲波採樣被量化後所產生的非壓縮數據,故被視為單純的無損耗編碼格式,其優點是可獲得高質量的音頻信號。基於PCM編碼的WAV格式是最基本的WAV格式,被聲卡直接支持,能直接存儲採樣的聲音數據,所存儲的數據能直接通過聲卡播放,還原的波形曲線與原始聲音波形十分接近,播放的聲音質量是一流的,在Windows平台下被支持得最好,常常被用作在其它編碼的文件之間轉換的中間文件。PCM的缺點是文件體積過大,不適合長時間記錄。正因為如此,又出現了多種在PCM編碼的基礎上經改進發展起來的編碼格式,如:DPCMADPCM編碼等。 [2] 

WAV影響因素

採樣頻率:每秒鐘採集音頻數據的次數。採樣頻率越高,音頻保真度越高。計算機廣泛配置的16位聲卡,使用的採樣頻率通常包括11025Hz、22050Hz、44100Hz和48000Hz四種,其中,採用11025Hz採樣的聲音效果相當於電話聲音的效果;採用22050HZ採樣的聲音效果相當於FM調頻廣播的效果;採用44100HZ採樣的聲音效果相當於CD聲音的效果。
採樣位數(振幅採樣精度):即採樣值或取樣值,是用來衡量聲音波動變化的一個參數,也是聲卡的分辨率。它的數值越大,分辨率也就越高,發出聲音的能力越強。目前計算機中配置的16位聲卡的採樣位數包括8位和16位兩種。
聲道數:有單聲道立體聲之分,單聲道的聲音只能使用一個喇叭發聲(有的聲卡也將單聲道信息處理成兩個喇叭同時輸出),立體聲的WAV可以使兩個喇叭都發聲(一般左右聲道有分工),這樣更能感受到音頻信息的空間效果。顯然,雙聲道數據還原特性更接近人們的聽力習慣,但採集得到的數據量會增加1倍。 [3] 

WAV適用範圍

一般來説,採樣的樣本尺度(信息量)越大,採樣頻率越高,音質就越好,但波形音頻的開銷就越大。由於一般講話以8位11.025KHz採樣就能較好地還原,因此,波形音頻一般適用於以下幾種場合:
1、播放的聲音是講話語音,音樂效果對聲音的質量要求不太高的場合。
2、需要從CD-ROM光盤驅動器同時加載聲音和其他數據,聲音數據的傳輸不能獨佔處理時間的場合。
3、需要在PC硬盤中存儲的聲音數據在1分以下以及可用存儲空間足夠的時候。 [4] 
參考資料