複製鏈接
請複製以下鏈接發送給好友

H.323音視頻協議

鎖定
H.323是一種標準的音視頻傳輸協議,能夠實現遠程提審功能。
中文名
H.323音視頻協議
外文名
H.323Audio video protocol
構    成
一組協議
負    責
音頻視頻信號的編碼解碼和包裝
特    徵
具備做電信級大網的特徵

H.323音視頻協議簡介

H.323ITU-T第16工作組的建議,由一組協議構成,其中有負責音頻與視頻信號的編碼、解碼和包裝,有負責呼叫信令收發和控制的信令,還有負責能力交換的信令。H.323的第4版本具備做電信級大網的特徵,以它為標準構建的IP電話網能很容易地與傳統PSTN電話網兼容,從這點上看,H.323更適合於構建電話到電話的電信級大網。
H.323協議族規定了在主要包括IP網絡在內的基於分組交換的網絡上提供多媒體通信的部件、協議和規程。H.323一共定義了四種部件:終端,網關網守多點控制單元。利用它們,H.323可以支持音頻、視頻和數據的點到點或點到多點的通信。H.323協議族包括用於建立呼叫的H.225.0、用於控制的H.245、用於大型會議的H.332 以及用於補充業務的H.450.X等。H.323 協議中包含3條信令控制信道:RAS信令信道、呼叫信令信道和H.245 控制信道。3 條信道的協調工作使得H.323的呼叫得以進行。 [1] 

H.323音視頻協議體系結構

為了能在不保證QoS分組交換網絡上展開多媒體會議,由ITU的第15研究組SG-15於1996年通過H.323建議的第一版,並在1998年提出了H.323的第二版。H.323制定了無QoS(服務質量)保證的分組網絡PBN(packet Based Networks)上的多媒體通信系統標準,這些分組網絡主宰了當今的桌面網絡系統,包括基於TCP/IP、IPX分組交換以太網快速以太網令牌網、FDDI技術。因此,H.323標準LAN、WAN、Internet、因特網上的多媒體通信應用提供了技術基礎和保障。
H.323是ITU多媒體通信系列標準H.32x的一部份,該系列標準使得在現有通信網絡上進行視頻會議成為可能,其中,H.320是在N-ISDN上進行多媒體通信的標準:H.321是在B-ISDN上進行多媒體通信的標準:H.322是在有服務質量保證的LAN上進行多媒體通信的標準:H.324是在GSTN和無線網絡上進行多媒體通信的標準。H.323為現有的分組網絡PBN(如IP網絡)提供多媒體通信標準。若和其它的IP技術如IETF資源預留協議RSVP相結合,就可以實現IP網絡的多媒體通信。基於IP的LAN正變得越來越強大,如IP over SDH/SONET、IP over ATM技術正在快速發展以及LAN寬帶正在不斷的提高。由於能提供設備與設備、應用與應用、供應商與供應商之間的互操作能力,因此,H.323能夠保證所有H.323兼容設備的互操作性。更高速率的處理器、日益增強的圖形器件和強大的多媒體加速芯片使提PC成為一個越來越強大的多媒體平台。H.323可提供PBN與別的網絡之間進行多媒體通信的互連互通標準。許多計算機、網絡通信公司,如Inter、Microsoft和Netscape都支持H.323標準H.323標準包括在無QoS保證的分組網絡中進行多媒體通信所需的技術要求。這些分組網絡包括LAN、WAN、Internet/因特網以及使用PPP等分組協議通過GSTN或ISDN的撥號連接或點對點連接。
從整體上來説,H.323是一個框架性建設,它涉及到終端設備、視頻、音頻和數據傳輸、通信控制、網絡接口方面的內容,還包括了組成多點會議的多點控制單元(MCU)、多點控制器(MC)、多點處理器(MP)、網關以及關守等設備。它的基本組成單元是"域",在H.323系統中,所謂域是指一個由關守管理的網關、多點控制單元(MCU)、多點控制器(MC)、多點處理器(MP)和所有終端組成的集合。一個域最少包含一個終端,而且必須有且只有一個關守。H.323系統中各個邏輯組成部份稱為H.323的實體,其種類有:終端、網關、多點控制單元(MCU)、多點控制器(MC)、多點處理器(MP)。其中終端、網關、多點控制單元(MCU)是H.323中的終端設備,是網絡中的邏輯單元。終端設備是可呼叫的和被呼叫的,而有些實體是不通被呼叫的,如關守。H.323包括了H.323終端與其它終端之間的、通過不同網絡的、端到端的連接。 [2] 
體系結構 體系結構

H.323音視頻協議終端組成

H.323為基於網絡的通信系統定義了四個主要的組件:終端(Terminal)、網關(Gateway)、關守(Gatekeeper)、多點控制單元(MCU)。終端是分組網絡中能提供實時、雙向通信的節點設備,也是一種終端用户設備,可以和網關、多點接入控制單元通信。所有終端都必須支持語音通信,視頻和數據通信可選。H.323規定了不同的音頻、視頻或數據終端協同工作所需的操作模式。它將是下一代因特網電話、音頻會議終端和視頻會議技術的主要標準。圖為H.323終端的組成框圖,在發端,從輸入設備獲取的視頻和音頻信號,經編碼器壓縮後,按照一定格式打包,通過網絡發送出去,在收端,來自網絡的數據包首先被解包,獲得的視頻、音頻壓縮數據經解碼後送入輸出設備,用户數據和控制數據也得到了相應的處理。它所包含的各個功能單元及其標準備或協議分別是:
視頻編解碼(H.263/H.261):完成對視頻碼流的冗餘壓縮編碼。
音頻編解碼(H.723.1等):完成語音信號的編解碼,並在接收端可選擇地加入緩衝延遲以保證語音的連續性。所採用的標準為ITU-T的H.723.1,它提供5.3kbit/s和6.3kbit/s兩種碼率,採用線性預測綜合分析編碼方法,分別使用代數碼本激勵線性預測和多脈衝最大似然量化,從而各自獲得編碼複雜度和質量的優化。
各種數據應用:包括電子白板、靜止圖像傳輸、文件交換、數據庫共存、數據會議、運程設備控制等,可用的標準為T.120、T.84、T.434等。
控制單元(H.245):提供端到端信令,以保證H.323終端的正常通信。所採用的協議為H.245(多媒體通信控制協議),它定義了請求、應答、信令和指示四種信息,通過各種終端間進行通信能力協商,打開/關閉邏輯信道,發送命令或指示等操作,完成對通信的控制。
H.225層:將視頻、音頻、控制等數據格式化併發送,同時從網絡接收數據。另外,還負責處理一些諸如邏輯分幀、加序列號、錯誤檢測等功能。
H.323終端 H.323終端

H.323音視頻協議協議簇

H.323國際電信聯盟(ITU)的一個標準協議棧,該協議棧是一個有機的整體,根據功能可以將其分為四類協議,也就是説該協議從系統的總體框架(H.323)、視頻編解碼(H.263)、音頻編解碼(H.723.1)、系統控制H.245)、數據流的複用(H.225)等各方面作了比較詳細的規定。為網絡電話可視電話會議系統的進一步發展和系統的兼容性提供了良好的條件。其中系統控制協議包括H.323、H.245、和H.225.0,Q.931和RTP/RTCP是H.225.0的主要組成部份。系統控制是H.323終端的核心。整個系統控制由H.245控制信道、H.225.0呼叫信令信道和RAS(註冊、許可、狀態)信道提供,音頻編解碼協議包括G.711協議(必選)、G.722G.723.1G.728G.729等協議。編碼器使用的音頻標準必須由H.245協議協商確定。H.323終端應由對本身所具有的音頻編解碼能力進行非對稱操作。如以G.711發送,以G.729接收。視頻編解碼協議主要包括H.261協議(必選)和H.263協議。H.323系統中視頻功能是可選的。數據會議功能也是可選的,其標準是多媒體會議數據協議T.120

H.323音視頻協議通信原理

H.323多媒體通信系統中,控制信令數據流的傳送利用了面向連接的傳輸機制。在IP遊戲棧中,IP與TCP協作,共同完成面向連接的傳輸。可靠的傳輸保證了數據數據包傳輸時的流量控制、連續性以及正確性,但也可能引起傳輸時延以及佔用網絡寬帶。H.323將可靠的TCP用於H.245控制信道T.120數據信道,呼叫信令信道。而視頻和音頻信息採用不可靠的、面向非連接的傳輸方式,即利用用户數據協議UDP(User Datagram Protocol)。UDP無法提供很好的QoS,只提供最少的控制信息,因此傳輸時延較TCP小。 在有多個視頻流音頻流的多媒體通信系統中,基於UDP和不可靠傳輸利用IP多點廣播和由IETF實時傳輸協議RTP處理視頻和音頻信息。IP多播是以UDP方式進行不可靠多點廣播傳輸的協議。RTP工作於IP多播的頂層,用於處理IP網上的視頻和音頻流,每個UDP包均加上一個包含時間戳和序號的報頭。若接收端配以適當的緩衝,那麼它就可以種用時間戳和序號信息"復原,再生"數據包、記錄失序包、同步語音、圖像和數據以及改善邊接重放效果。實時控制協議RTCP用於RTP的控制。RTCP監視服務質量以及網上傳送的信息,並定期將包含服務質量信息的控制信息包發分給所有通信節點
在大型分組網絡如因特網中,為一個多媒體呼叫保留點足夠的寬帶是很重要的,也是很困難的。另一個IETF協議--資源預流協議RSVP允許接收端為某一特殊的數據流申請一定數量的寬帶,並得到一個答覆,確認申請是否被許可。雖然RSVP不是H.323標準的正式組成部份,但大多數H.323產品都必須支持他,因為寬帶的預流對IP網絡上多媒體通信的成功至關重要,RSVP需要得到終端、網關、裝有多點處理器的MCU以及中間路由器交換機的支持。 [3] 

H.323音視頻協議相關音視頻協議

H.225.0適用於不同類型的網絡,其中包括以太網令牌環網等。H.225.0被定義在諸如TCP/IP,SPX/IPX傳輸層。H.225.0通信的範圍是在H.323網關之間,並且是在同一個網上,使用同一種傳輸協議。如果在整個因特網上使用H.323協議,通信性能將會下降。H.323試圖把H.320擴展到無質量保證的局域網中,通過使用強大的認可控制會議控制,使一個專門會議的參加者從幾人到幾千人。
H.225.0建立了一個呼叫模型,在這個模型中,呼叫建立和性能協商沒有使用RTP傳輸地址,呼叫建立之後才建立若干個RTP/RTCP連接。呼叫建立之前,終端可以向某個關守(Gatekeeper)註冊。如果終端要向某個關守註冊,它必須知道這個關守的年限(Vintage)。正因為如此,發現(discovery)和註冊(registion)結構都包含了一個H.245類型的對象標誌,它提供了H.323應用版本的年限。這些結構還包含了可選擇的非標準消息,它允許終端建立非標準關係。在這些結構的末尾,還包括了版本號的非標準狀態。其中:版本號是必須的,非標準信息是可選的。非標準信息用來在兩個終端之間相通知其年限及非標準狀態。雖然所有的Q.931消息在用户到用户信息中具有可選的非標準信息,但在所有的RAS通道信息中還是具有可選的非標準信息。另外,在任何時候都能發送一個非標準RAS消息。進行註冊、認可和狀態通信的不可靠通道稱為RAS通道。開始一個呼叫一般必須首先發送一個認可請求消息,接着發送一個初始建立消息,這個過程以收到連接消息為結束。
當可靠的H.245控制通道建立之後,音頻、視頻以及數據的傳輸通道都可以相應建立。多媒體會議的有關設置也可以在這裏設置。當使用可靠的H.245控制通道傳送消息後,H.225終端可以通過不可靠通道發送音頻、視頻數據。錯誤隱藏和其它一些信息是用來處理發生丟包的情況。一般情況下,音頻、視頻數據包不會重發,因為重發將引起網絡網絡上的延時。假設底層已經處理了對位出錯的檢測,而且錯誤的包不會傳給H.225。音頻、視頻數據和呼叫信號不會在同一個通道里傳輸,並且不使用同樣的消息結構。H.225.0有能力使用不同的傳輸地址,在不同的RTP實例當中發送和接收音頻、視頻數據,以確保不同媒體幀的序列號和每種媒體的服務質量。ITU正在研究如何把音頻、視頻數據包混合在同一個傳輸地址中同一幀中,雖然音頻、視頻數據能夠憑錯傳輸層服務訪問點標識來共享同一個網絡地址,但是製造商還是選擇使用不同的網絡地址來分別傳輸音頻、視頻數據。在網關多點控制單元和關守中可以使用動態傳輸層服務訪問點標識來代替固定傳輸層服務訪問點標識。
一個可靠的傳輸地址用於終端與終端之間的呼叫建立,也可以用於關守之間,可靠的呼叫信號連接必須按照下例規則進行。在終端與終端的呼叫信號傳輸中,每個終端都可以打開或關閉可靠呼叫信號通道。對於關守的呼叫信號傳輸,終端必須保證在整個過程中打開可靠端口。雖然關守能夠選擇是否關閉信號通道,但是對於網關正在使用的呼叫通道,關守必須保證它打開。諸如顯示信息等Q.931信息可以在端到端之間傳輸。如果由於傳輸層的某個原因使得可靠的連接被斷開,這個連接必須重建,此次呼叫不認為是失敗。除非H.245通道被關閉。呼叫狀態和呼叫參考值不受關閉可靠連接的影響。同一時間可以打開多個H.245通道,因此同一個終端可以同時參加多個會議。在一個會議中,一個終端甚至可以同時打開多種類型的通道,例如,同時打開兩個音頻通道來得到立體聲效果。但是在一個點對點的呼叫中只能打開一個H.245控制通道
H.245協議定義了主從判別功能,當在一個呼叫中的兩個終端同時初始化一個相同的事件時,就產生了衝突。例如,資源只能被一個事件使用。為了解決這個問題,終端必須判斷誰是主終端,誰是從終端,主從判別過程用來判斷哪個終端是主終端,哪個是從終端。終端的狀態一旦決定,在整個呼叫過程期間都不會改變。性能交換過程用來保證傳輸的媒體信號是能夠被接收端接收的,也就是接收端必須能夠解碼接收數據。這要求每一個終端的接收和解碼能力必須被對方終端知道。終端不需具備所有的能力,對於不能理解的要求可以不予理睬。終端通過發送它的性能集使對方知道自己的接收和解碼能力。接收性能描述了終端接收和處理信息流的能力。發送必須確保所發送的性能集的內容是自己能夠做到的。發送性能給接收方提供了操作方式的選擇集,接收方可以從中選擇某種方式。如果缺省了發送性能集,這説明了發送方沒有給接收方選擇,但這並不説明發送方不會向接收方發送數據。這些性能集使得終端可以同時提供多種媒體流的處理。例如,一個終端可以同時接收兩路不同的H.262視頻信號和兩路不同的H.722音頻信號。性能消息描述的不僅僅是終端具有的固有能力,還描述了它可以同時具有哪些模型。它也可能表示了發送性能和接收性能之間的一種折中。終端可以使用非標準參數結構來發送非標準性能和控制消息。非標準消息是製造商或其它組織定義的,用來表明其終端所具有的特殊能力。
邏輯通道信號過程確保在邏輯通道打開時,終端就具有接收和解碼數據的能力。打開邏輯通道消息包含了關於傳送數據的描述。邏輯通道必須在終端有能力同時接收所有打開通道的數據時才通被打開。一個邏輯通道由傳送方打開。接收方可以向傳送方請求關閉邏輯通道,傳送方可以接受請求,也可以拒絕請求。當性能交換結束時,雙方終端通過交換的性能描述符都知道了對方的性能。終端不需要知道描述符中所有性通,只要知道它使用的性能即可。終端知道自己與對方終端的環型延時是很有用的。環型延時判別就是用來測試環型延時的,它還可以用來測試遠方終端是否存在。命令和説明可以用來傳送一些特殊的數據。命令和説明不會得到遠程終端的響應消息。命令用於強迫遠程終端執行一個動作,説明用於提供信息。
H.323通信 H.323通信
H.323協議規定,音頻和視頻分組必須被封裝在實時協議RTP中,並通過發送端和接收端的一個UDP的Socket對來進行承載。而實時控制協議RTCP用來評估會話和連接質量,以及在通信方之間提供反饋信息。相應的數據及其支持性的分組可以通過TCP或UDP進行操作。H.323協議還規定,所有的H.323終端都必須帶一個語音編碼器,最低要求是必須支持G.711建議。 [4] 
參考資料
  • 1.    蔡高. H.323協議的系統描述[J]. 黃石教育學院學報, 2003(2):48-52.
  • 2.    馬二虎. 基於H.323協議的視頻會議系統的研究與實現[D]. 北京郵電大學, 2006.
  • 3.    何愛香. 基於H.323協議的視頻會議及其技術研究[D]. 北京工業大學, 2005.
  • 4.    餘前佳. 基於H.323協議的視頻會議系統QoS保證[J]. 國土資源信息化, 2012(6):43+48-50.