複製鏈接
請複製以下鏈接發送給好友

音頻採樣

鎖定
音頻採樣率是指錄音設備在單位時間內對模擬信號採樣的多少,採樣頻率越高,機械波的波形就越真實越自然。在當今的主流採集卡上,採樣頻率一般共分為11025Hz、22050Hz、24000Hz、44100Hz、48000Hz五個等級,11025Hz能達到AM調幅廣播的聲音品質,而22050Hz和24000HZ能達到FM調頻廣播的聲音品質,44100Hz則是理論上的CD音質界限,48000Hz則更加精確一些。
中文名
音頻採樣
外文名
Audio sampling
相關學科
計算機科學音頻信號處理通信

目錄

音頻採樣常用的採樣率

數字音頻領域,常用的採樣率有:
8,000 Hz - 電話所用採樣率, 對於人的説話已經足夠
11,025 Hz-AM調幅廣播所用採樣率
22,050 Hz和24,000 Hz- FM調頻廣播所用採樣率
32,000 Hz - miniDV (數碼視頻攝像機)、DAT (LP mode)所用採樣率
44,100 Hz - 音頻 CD, 也常用於 MPEG-1 音頻(VCD, SVCD, MP3)所用採樣率
47,250 Hz - 商用 PCM 錄音機所用採樣率
48,000 Hz - miniDV、數字電視DVD、DAT、電影和專業音頻所用的數字聲音所用採樣率
50,000 Hz - 商用數字錄音機所用採樣率
96,000 或者 192,000 Hz - DVD音頻、一些 LPCM DVD 音軌BD-ROM(藍光盤)音軌、和 HD-DVD (高清晰度 DVD)音軌所用所用採樣率
採樣流程 採樣流程
2.8224 MHz - 直接數字信號流(Direct Stream Digital) 的 1 位 sigma-delta 調製過程所用採樣率。

音頻採樣用例

聲波其實是一種機械波,因此也有波長振幅的特徵,波長對應於時間軸線,振幅對應於採樣值軸線。波是無限光滑的,絃線可以看成由無數點組成,由於存儲空間是相對有限的,數字編碼過程中,必須對絃線的點進行採樣。採樣的過程就是抽取某點的採樣值,很顯然,在單位時間中內抽取的點越多,獲取得波長信息更豐富,為了復原波形,一個週期中,必須有至少2個點的採樣,人耳能夠感覺到的最低波長為1.7cm,即20000Hz,因此要滿足人耳的聽覺要求,則1s採樣至少40000次,用40000Hz(40kHz)表達,這個40kHz就是採樣率。我們常見的CD,採樣率為44.1kHz。
採集過程中視頻音頻同步是非常重要的,光有波長信息是不夠的,我們還必須獲得該波長的能量值並量化,用於表示信號強度。量化電平數為2的整數次,我們常見的CD位16級的採樣大小,即2的4次方。採樣大小相對採樣率更難理解,因為要顯得抽象點,舉個簡單例子:假設對一個波進行8次採樣,採樣點分別對應的能量值分別為A1-A8,但我們只使用2bit的採樣大小,結果我們只能保留A1-A8中4個點的值而捨棄另外4個。如果我們進行3bit的採樣大小,則剛好記錄下8個點的所有信息。採樣率和採樣大小的值越大,記錄的波形更接近原始信號。

音頻採樣比特率

音頻採樣VBR

VBR(Variable Bitrate),動態比特率。也就是沒有固定的比特率,壓縮軟件在壓縮時根據音頻數據即時確定使用什麼比特率。這是新發展的算法,他們將一首歌的複雜部分用高比特率(Bitrate)編碼,簡單部分用低比特率編碼。主意雖然不錯,可惜新編碼器的VBR算法很差,音質與CBR相去甚遠。幸運的是, Lame很好地優化了VBR算法,使之成為MP3的最佳編碼模式。這是以質量為前提兼顧文件大小的方式,推薦編碼模式。

音頻採樣ABR

ABR(Average Bitrate),平均比特率,是VBR的一種插值參數。Lame針對CBR不佳的文件體積比和VBR生成文件大小不定的特點獨創了這種編碼模式。ABR也被稱為“Safe VBR”,它是在指定的平均比特率內,以每50幀(30幀約1秒)為一段。舉例來説,當指定用192kbps ABR對一段wav文件進行編碼時,Lame會將該文件的85%用192kbps固定編碼,然後對剩餘15%進行動態優化:複雜部分用高於192kbps 來編碼、簡單部分用低於192kbps來編碼。與192kbps CBR相比,192kbps ABR在文件大小上相差不多,音質卻提高不少。ABR編碼在速度上是VBR編碼的2到3倍,在128-256kbps範圍內質量要好於CBR。可以做為 VBR和CBR的一種折衷選擇。

音頻採樣CBR

CBR(Constant Bitrate),常數比特率,指文件從頭到尾都是一種位速率。相對於VBR和ABR來講,它壓縮出來的文件體積很大,但音質卻不會有明顯的提高。

音頻採樣MP3

MP3的全稱應為MPEG1 Layer-3音頻文件,MPEG(Moving Picture Experts Group)在漢語中譯為活動圖像專家組,特指活動影音壓縮標準,MPEG音頻文件是MPEG1標準中的音頻部分,也叫MPEG音頻層,它根據壓縮質量和編碼複雜程度劃分為三層,即Layer-1、Layer2、Layer3,且分別對應MP1MP2、MP3這三種文件,並根據不同的用途,使用不同層次的編碼。
MPEG音頻編碼的層次越高,編碼器越複雜,壓縮率也越高,MP1和MP2的壓縮率分別為4:1和6:1-8:1,而MP3的壓縮率則高達 10:1-12:1,也就是説,一分鐘CD音質的音樂,未經壓縮需要10MB的存儲空間,而經過MP3壓縮編碼後只有1MB左右。 [2] 
(另MP3PRO: mp3PRO編碼器將音頻的錄音分成兩個部分:mp3部分和PRO部分。mp3部分分析長波段(Long Wavelength Band)信息,並將其編碼成通常的mp3文件數據流。這就使得編碼器能夠集中編碼更多的有用信息,獲得更佳品質的編碼效果。同時,這也保證了 mp3PRO文件同老的mp3播放器的兼容性。PRO部分分析的則是短波段(Short Wavelength Band)信息,並將其編碼成mp3數據流的一部分,而這些通常在老的mp3解碼器裏是被忽略的。新的mp3PRO解碼器會有效地利用這部分數據流,將兩段(短波段和長波段)合併起來產生完全的波段,達到增強音質的效果。 [1] 
參考資料
  • 1.    音頻採樣概念   .中文IT社區[引用日期2012-05-30]
  • 2.    宋子然.100年漢語新詞新語大辭典1912年—2011年(下冊).上海:上海世紀出版股份有限公司:上海辭書出版社,2014