複製鏈接
請複製以下鏈接發送給好友

MPEG-4標準

鎖定
運動圖像專家組MPEG 於1999年2月正式公佈了MPEG-4(ISO/IEC14496)標準第一版本。同年年底MPEG-4第二版亦告底定,且於2000年年初正式成為國際標準。
MPEG-4與MPEG-1和MPEG-2有很大的不同。MPEG-4不只是具體壓縮算法,它是針對數字電視、交互式繪圖應用(影音合成內容)、交互式多媒體(WWW、資料擷取與分散)等整合及壓縮技術的需求而制定的國際標準。
MPEG-4標準將眾多多媒體應用集成於一個完整框架內,旨在為多媒體通信及應用環境提供標準算法及工具,從而建立起一種能被多媒體傳輸、存儲、檢索等應用領域普遍採用的統一數據格式。
中文名
MPEG-4標準
提出者
運動圖像專家
2000年
國際標準
公佈時間
1999年2月

目錄

MPEG-4標準標準簡介

MPEG-4的編碼理念是:MPEG-4標準同以前標準的最顯著的差別在於它是採用基於對象的編碼理念,即在編碼時將一幅景物分成若干在時間和空間上相互聯繫的視頻音頻對象,分別編碼後,再經過複用傳輸到接收端,然後再對不同的對象分別解碼,從而組合成所需要的視頻和音頻。這樣既方便我們對不同的對象採用不同的編碼方法和表示方法,又有利於不同數據類型間的融合,並且這樣也可以方便的實現對於各種對象的操作及編輯。例如,我們可以將一個卡通人物放在真實的場景中,或者將真人置於一個虛擬的演播室裏,還可以在互聯網上方便的實現交互,根據自己的需要有選擇的組合各種視頻音頻以及圖形文本對象。
MPEG-4包含了MPEG-1及MPEG-2的絕大部分功能及其他格式的長處,並加入及擴充對虛擬現實模型語言(VRML,Virtual Reality Modeling Language)的支持,面向對象的合成文件(包括音效,視頻及VRML對象),以及數字版權管理(DRM)及其他交互功能。而MPEG-4比MPEG-2更先進的其中一個特點,就是不再使用宏區塊做視頻分析,而是以視頻上個體為變化記錄,因此儘管視頻變化速度很快、碼率不足時,也不會出現方塊畫面。
由於MPEG-4是一個公開的平台,各公司、機構均可以根據MPEG-4標準開發不同的制式,因此市場上出現了很多基於MPEG-4技術的視頻格式,例如WMV 9、Quick Time、DivX、Xvid等。MPEG-4大部分功能都留待開發者決定採用是否。這意味着整個格式的功能不一定被某個程序所完全函括。因此,這個格式有所謂配置(profile)及級別(level),定義了MPEG-4應用於不同平台時的功能集合。
MPEG-4系統的一般框架是:對自然或合成的視聽內容的表示;對視聽內容數據流的管理,如多點、同步、緩衝管理等;對靈活性的支持和對系統不同部分的配置 [1] 

MPEG-4標準優點

與MPEG-1、MPEG-2相比,MPEG-4具有如下獨特的優點:
基於內容的交互性
MPEG-4提供了基於內容的多媒體數據訪問工具,如索引、超級鏈接、上下載、刪除等。利用這些工具,用户可以方便地從多媒體數據庫中有選擇地獲取自己所需的與對象有關的內容,並提供了內容的操作和位流編輯功能,可應用於交互式家庭購物,淡入淡出的數字化效果等。MPEG-4提供了高效的自然或合成的多媒體數據編碼方法。它可以把自然場景或對象組合起來成為合成的多媒體數據。
高效的壓縮性
MPEG-4基於更高的編碼效率。同已有的或即將形成的其它標準相比,在相同的比特率下,它基於更高的視覺聽覺質量,這就使得在低帶寬的信道上傳送視頻、音頻成為可能。同時MPEG-4還能對同時發生的數據流進行編碼。一個場景的多視角或多聲道數據流可以高效、同步地合成為最終數據流。這可用於虛擬三維遊戲、三維電影、飛行仿真練習等
通用的訪問性
MPEG-4提供了易出錯環境的魯棒性,來保證其在許多無線和有線網絡以及存儲介質中的應用,此外,MPEG-4還支持基於內容的的可分級性,即把內容、質量、複雜性分成許多小塊來滿足不同用户的不同需求,支持具有不同帶寬,不同存儲容量的傳輸信道和接收端 [2] 

MPEG-4標準部分

MPEG-4由一系列的子標準組成,被稱為部(part)(有時也譯為卷),包括以下的部分:
第一部分(ISO/IEC 14496-1):系統:描述視頻和音頻數據流的控制、同步以及混合方式(即混流Multiplexing,簡寫為MUX)。
第二部分(ISO/IEC 14496-2):視頻:定義一個對各種視覺信息(包括自然視頻、靜止紋理、計算機合成圖形等等)的編解碼器。(例如XviD編碼就屬於MPEG-4 Part 2)
第三部分(ISO/IEC 14496-3):音頻:定義一個對各種音頻信號進行編碼的編解碼器的集合。包括高級音頻編碼(Advanced Audio Coding,縮寫為AAC)的若干變形和其他一些音頻/語音編碼工具。
第四部分(ISO/IEC 14496-4):一致性:定義對本標準其他的部分進行一致性測試的程序。
第五部分(ISO/IEC 14496-5):參考軟件:提供用於演示功能和説明本標準其他部分功能的軟件。
第六部分(ISO/IEC 14496-6):多媒體傳輸集成框架(DMIFfor Delivery Multimedia Integration Framework)
第七部分(ISO/IEC 14496-7):優化的參考軟件:提供對實現進行優化的例子(這裏的實現指的是第五部分)。
第八部分(ISO/IEC 14496-8):在IP網絡上傳輸:定義在IP網絡上傳輸MPEG-4內容的方式。
第九部分(ISO/IEC 14496-9):參考硬件:提供用於演示怎樣在硬件上實現本標準其他部分功能的硬件設計方案。
第十部分(ISO/IEC 14496-10):高級視頻編碼或稱高級視頻編碼(Advanced Video Coding,縮寫為AVC):定義一個視頻編解碼器(codec)。AVC和XviD都屬於MPEG-4編碼,但由於AVC屬於MPEG-4 Part 10,在技術特性上比屬於MPEG-4 Part2的XviD要先進。另外,它和ITU-TH.264標準是一致的,故又稱為H.264。
第十二部分(ISO/IEC 14496-12):基於ISO的媒體文件格式:定義一個存儲媒體內容的文件格式。
第十三部分(ISO/IEC 14496-13):知識產權管理和保護(IPMP for Intellectual Property Management and Protection)拓展。
第十四部分(ISO/IEC 14496-14):MPEG-4文件格式:定義基於第十二部分的用於存儲MPEG-4內容的視頻文件格式。
第十五部分(ISO/IEC 14496-15):AVC文件格式:定義基於第十二部分的用於存儲第十部分的視頻內容的文件格式。
第十六部分(ISO/IEC 14496-16):動畫框架擴展(AFX: Animation Framework eXtension)。
第十七部分(ISO/IEC 14496-17):同步文本字幕格式。
第十八部分(ISO/IEC 14496-18):字體壓縮和流式傳輸(針對開放字體格式Open Font Format)。
第十九部分(ISO/IEC 14496-19):合成材質流(Synthesized Texture Stream)。
第二十部分(ISO/IEC 14496-20):簡單場景表示(LASeR for Lightweight Scene Representation。
第二十一部分(ISO/IEC 14496-21):用於描繪(Rendering)的MPEG-J拓展。
第二十二部分(ISO/IEC 14496-22):開放字體格式(Open Font Format)。
第二十三部分(ISO/IEC 14496-23):符號化音樂表示(Symbolic Music Representation)。
第二十四部分(ISO/IEC 14496-24):音頻與系統交互作用(Audio and systems interaction)。
第二十五部分(ISO/IEC 14496-25):3D圖形壓縮模型(3D Graphics Compression Model)。
第二十六部分(ISO/IEC 14496-26):音頻一致性檢查:定義測試音頻數據與ISO/IEC 14496-3是否一致的方法(Audio conformance)。
第二十七部分(ISO/IEC 14496-27):3D圖形一致性檢查:定義測試3D圖形數據與ISO/IEC 14496-11:2005, ISO/IEC 14496-16:2006, ISO/IEC 14496-21:2006,和ISO/IEC 14496-25:2009是否一致的方法(3D Graphics conformance)。

MPEG-4標準應用

這些特點無疑會加速多媒體應用的發展,從中受益的應用領域有:因特網多媒體應用;廣播電視;交互式視頻遊戲;實時可視通信;交互式存儲媒體應用;演播室技術及電視後期製作;採用面部動畫技術的虛擬會議;多媒體郵件;移動通信條件下的多媒體應用;遠程視頻監控;通過ATM網絡等進行的遠程數據庫業務等。MPEG-4主要應用如下:
因特網視音頻廣播
由於上網人數與日俱增,傳統電視廣播的觀眾逐漸減少,隨之而來的便是廣告收入的減少,所以現在的固定式電視廣播最終將轉向基於TCP/IP的因特網廣播,觀眾的收看方式也由簡單的遙控器選擇頻道轉為網上視頻點播視頻點播的概念不是先把節目下載到硬盤,然後再播放,而是流媒體視頻(streaming video),點擊即觀看,邊傳輸邊播放。
現在因特網中播放視音頻的有:Real Networks公司的 Real Media,微軟公司的 Windows Media,蘋果公司的 QuickTime,它們定義的視音頻格式互不兼容,有可能導致媒體流中難以控制的混亂,而MPEG-4為因特網視頻應用提供了一系列的標準工具,使視音頻碼流具有規範一致性。因此在因特網播放視音頻採用MPEG-4,應該説是一個安全的選擇。
無線通信
MPEG-4高效的碼率壓縮,交互和分級特性尤其適合於在窄帶移動網上實現多媒體通信,未來的手機將變成多媒體移動接收機,不僅可以打移動電視電話、移動上網,還可以移動接收多媒體廣播和收看電視。
靜止圖像壓縮
靜止圖像(圖片)在因特網中大量使用,現在網上的圖片壓縮多采用JPEG技術。MPEG-4中的靜止圖像(紋理)壓縮是基於小波變換的,在同樣質量條件下,壓縮後的文件大小約是JPEG壓縮文件的十分之一。把因特網上使用的JPEG圖片轉換成MPEG-4格式,可以大幅度提高圖片在網絡中的傳輸速度。
電視電話
傳統用於窄帶電視電話業務的壓縮編碼標準,如H261,採用幀內壓縮幀間壓縮、減少象素和抽幀等辦法來降低碼率,但編碼效率和圖像質量都難以令人滿意。MPEG-4的壓縮編碼可以做到以極低碼率傳送質量可以接受的聲像信號,使電視電話業務可以在窄帶公用電話網上實現。
計算機圖形動畫與仿真
MPEG-4特殊的編碼方式和強大的交互能力,使得基於MPEG-4的計算機圖形和動畫可以從各種來源的多媒體數據庫中獲取素材,並實時組合出所需要的結果。因而未來的計算機圖形可以在MPEG-4語法所允許的範圍內向所希望的方向無限發展,產生出今天無法想象的動畫及仿真效果。
電子遊戲
MPEG-4可以進行自然圖像與聲音同人工合成的圖像與聲音的混合編碼,在編碼方式上具有前所未有的靈活性,並且能及時從各種來源的多媒體數據庫中調用素材。這可以在將來產生象電影一樣的電子遊戲,實現極高自由度的交互式操作 [3] 
參考資料