複製鏈接
請複製以下鏈接發送給好友

視音頻編解碼技術

鎖定
視音頻編解碼涉及很多項視頻和音頻處理技術,每一項技術的改進都對視音頻編碼做出貢獻,但作為一套完整、高效的編碼方案,需要集中全人類在視音頻編解碼方面的最新智慧。個人或公司的研究成果,都希望被標準化組織,其經濟回報是標準使用費。
中文名
視音頻編解碼技術
運動搜索
引入多參考幀
殘餘編碼
採用整型4*4 DCT變換
方    面
數字化視音頻編解碼
類    型
視、音頻處理技術

視音頻編解碼技術國際標準化組織

視音頻編解碼技術基本介紹

視音頻編碼國際標準化組織及其壓縮標準介紹:
國際上有兩個負責視音頻編碼的標準化組織,一個是VCEG(Video code Expert Group),是國際電信聯合會下的視頻編碼專家組,一個是MPEG(Motion Picture Expert Group),是國際標準化組織下的運動圖像專家組。這兩個視音頻編碼標準化組織都對視音頻的編解碼做出了非常重要的貢獻:一是推動視音頻編碼技術的發展,一是推動視音頻編解碼的應用。

視音頻編解碼技術詳細介紹

這兩個標準化組織制定的相關編碼標準都獲得了廣泛的應用,VCEG制定的標準有H.261(被國際電信聯合會選定為電視會議的視頻壓縮標準)、H.262(該標準同MPEG-2完全一樣,是VCEG同MPEG組成的聯合編碼專家組JVT制定的壓縮標準,VCEG發佈的是H.262,MPEG發佈的是MPEG-2)、H.263(該標準被國際電信聯合會選定為可視電話的視頻壓縮標準,有增強型版本H.263+、H.263++)、H.264(該標準是2002年5月VCEG為新一代交互式視頻通訊制定的標準)。MPEG名氣要大得多,制定的標準有MPEG-1、MPEG-2、MPEG-4、MPEG-7和MPEG-21 ,MPEG-1壓縮標準為VCD所採納,MPEG-2的壓縮標準為DVD採納,MPEG-4是為交互式多媒體通訊制定的壓縮標準,MPEG-7是為互聯網視頻檢索制定的壓縮標準。
VCEG制定的壓縮標準H.26X都是針對單一矩形視頻對象,其追求的是更高的壓縮效率。MPEG-4在目前之所以很熱,是因為MPEG-4是基於多個視音頻對象的壓縮編碼標準,這非常適合於互聯網上的多媒體應用。在互聯網上傳播的多媒體信息,很多是可以劃分為多個視頻對象的,如電腦製作的動畫節目、電視新聞節目等,而在實時視頻圖像編碼中,在一個圖象矩形框中很難實時識別多個視頻對象,還是把一個視頻源當作一個矩形視頻對象進行編碼。
VCEG在97年發佈H.263的壓縮標準後,制定了短期開發計劃H.26N和長期開發計劃H.26L,H.26N發展成H.263+和H.263++,H.26L經過5年時間的發展,在2002年5月作為H.264壓縮標準進行發佈。
MPEG在VCEG發佈H.263之後,發佈了MPEG-4 SP(即MPEG-4第一板),在該版本中引入了兩個非常重要的概念:一個是一個視頻源多個視音頻對象編碼,一個是碼流傳輸異常處理(特別是無線傳輸應用)。從這裏可以看出,VCEG致力於高效率的視頻編碼技術,MPEG更側重系統和框架。
在2001年第四季度,VCEG H.26L發展到TML9.0時,MPEG同VCEG再次組成聯合聯合視頻編碼專家組JVT,對H.26L的算法進行了改進和完善,在2003年5月VCEG發佈了H.264的壓縮標準。MPEG在JVT對H.26L壓縮算法修改的基礎上,將該技術規範納入到MPEG-4的標準中,作為MPEG-4 PART10發佈,即MPEG-4的第三版,MPEG-4 AVC。H.264和MPEG-4 AVC代表了全人類在視音頻編解碼方面的最新成果。
針對單一矩形視頻對象,MPEG-4 AVC比MPEG-4第二版MPEG-4 ACE的壓縮效率提高30%以上。

視音頻編解碼技術264與MPEG-4 PART10

同以前的視頻壓縮標準H.263++和MPEG-4 ACE相比,H.264與MPEG-4 PART10採用了一些新的算法,主要表現在以下幾個方面:

視音頻編解碼技術運動搜索

a、 引入多參考幀,
引入多達5個參考幀
b、 多種BLOCK形狀
有16*16、16*8、8*16、8*8、8*4、4*8、4*4七種BLOCK形狀。
c、運動搜索精度更高
1/2象素精度搜索採用了6階濾波器,搜索精度有很大提高。也引入了1/4象素精度搜索和1/8象素精度搜索。

視音頻編解碼技術殘餘編碼

a、 採用整型4*4 DCT變換
b、 量化技術改進
c、 採用DE-BLOCK技術
d、 SP幀技術
這些技術的改變,一方面提高了壓縮效率,另一方面運算強度大幅提高,大大地提高了實現的難度。

視音頻編解碼技術相關產品

視音頻編解碼技術產品介紹

海康威視從2000年5月進入視音頻編解碼這個行業,就緊跟標準化組織制定的視音頻編解碼標準的步伐,特別是在MPEG-4、H.26L等標準發展過程中,扮演實現者的角色,首先是在PC平台上實時實現壓縮標準所描述的視音頻編解碼,INTEL P3/P4處理器代表了當今微處理器的最高水平,無論是處理速度、內部高速緩存大小、外部存儲器處理速度,都是任何其它處理器無法比擬的,視音頻編解碼的處理能力,也是其它微處理器無法比擬的。PC平台上的實現,對於掌握編解碼算法,對不同算法的對比測試、各功能模塊的比較,都是非常有價值的,對於技術的積累非常重要。但PC平台上的應用,屬於商業化軟件的範疇,我們更適合做電子產品,在DSP上實時實現,降低產品成本、提高產品的可靠性,才有更大的實用價值。
從一個視音頻編解碼模型,到一個實用的視音頻編解碼軟件,要做大量的工作,從運算強度而言,要降低100倍以上。

視音頻編解碼技術主要成果

海康威視數字化視音頻編解碼方面做了大量的工作,主要成果在以下幾個方面:
1、 在PC(PIII 800MHz)平台上完成了MPEG-1的編碼和解碼;
2、 在PC(P4 1.4GHz)平台上完成了MPEG-4 ACE的編碼和解碼;
3、 在PC(P4 1.4GHz)平台上完成了H.264以及MPEG-4 AVC的編碼和解碼,在全球目前還沒有這方面的成果報道;
4、 在PHILIPS公司的DSP PNX1301(166MHz主頻)上完成了MPEG-4 ACE的編碼和解碼(CIF或QCIF分辨率),在全球目前還沒有這方面的成果報道;
5、 在PHILIPS公司的DSP PNX1301(180MHz)上完成了H.264的編碼和解碼(CIF或QCIF分辨率),在全球目前還沒有這方面的成果報道;
6、 在EQUATOR公司的DSP BSP-15-350(350MHz)上完成了MPEG-4 AVC的編解碼(Half D1分辨率),在全球目前還沒有這方面的成果報道。
其中,在PHILIPS公司的DSP PNX1301上完成了MPEG-4 ACE的編碼和解碼技術,應用在壓縮板卡上,已經產生了很好的經濟效益和社會效益。