複製鏈接
請複製以下鏈接發送給好友

隔行掃描

鎖定
隔行掃描(也稱為交錯)是一種對位圖圖像進行編碼的方法通過掃描或顯示每行或每行像素電子顯示屏上“繪製”視頻圖像(另一種是逐行掃描)的兩種常用方法之一。
它是一種在不消耗額外帶寬的情況下將視頻顯示的感知幀速率加倍的技術。隔行掃描信號包含在兩個不同時間捕獲的視頻幀的兩個場。這增強了觀看者的運動感知,並通過利用phi現象減少了閃爍
此技術使用兩個字段來創建框架。一個字段包含圖像中的所有奇數行;另一個包含所有偶數行。
中文名
隔行掃描
外文名
Interlace Scanning (簡寫i)
應    用
顯示設備(如電視機)
領    域
信息科學

隔行掃描説明

隔行掃描原理

隔行掃描(Interlaced)是在顯示設備表示運動圖像的方法,每一幀被分割為奇偶兩場圖像交替顯示,隔行掃描是一種減小數據量保證幀率的壓縮方法。
電視標準制訂者考慮到交流電頻率50或60Hz,所以確定了25或30fps的幀率(Frame rate),我國電視台標準為(PAL)制,指畫面掃描50每秒(每幀掃描2場畫面,共25個奇場25個偶場)。兩組25個字段一起工作,每1/25秒(或每秒25幀)創建一個完整的,兩場圖像構成一幀畫面可以使帶寬減小大約一半,但隔行掃描每1/50秒創建一個新的半幀(或每秒50個場) 。另外隔行掃描信號中的偽像不能完全消除,導致幀之間會丟失一點信息。 [1] 

隔行掃描編碼方法

隔行掃描編碼分兩種:
1、宏塊自適應幀場(MBAFF)編碼
允許使用宏塊對結構編碼為幀的圖像,可以將一個幀宏塊劃分為兩個場宏塊進行編碼;
2、圖像自適應幀場編碼(PAFF或PicAFF)
允許自由選擇的圖像混合編碼為完整幀,將兩場合併為一幀進行編碼,或者將兩場分別編碼。
當圖像同時存在運動區域和非運動區域時,由於PAFF自適應技術粒度太粗,無法實現滿足更加精細的編碼要求,於是在H.264MPEG-4第10部分高級視頻編碼MPEG-4 AVC))便引出了宏塊自適應幀場(MBAFF)編碼技術。
MBAFF對幀/場編碼的選擇是基於宏塊的,其將兩場合併為一幀進行編碼,但將每一個幀宏塊(16x16)劃分為場宏塊對(8*16),針對每一個幀宏塊,編碼器自動比較幀編碼和場編碼產生的碼流大小,然後使用最節省碼流的方式,並且可以避免產生偽像

隔行掃描目的

如果模擬廣播電視系統採用25或30幀逐行掃描掃描方式顯示,當電子束從屏幕的上半部分移到下半部時,屏幕上半部分的亮度就有了可以觀察到的衰減,於是畫面下半部分顯得更亮。這只是一個瞬間,事實上最亮的部分(當然就是電子束剛經過的區域)會不斷移動,從而產生閃爍現象。為防止閃爍,最佳的辦法是加倍刷新率,改成60p掃描,將每幅畫面掃描2次,因為在60分之一秒內,人眼能感覺到的亮度衰減就很小了。可是這樣做,單位時間內掃描的總行數會加倍,那麼水平掃描的速度就要加快。如此一來技術要求就會過高,以當時的條件做不到。於是標準制訂者想到了一個折衷的辦法,先花60分之一秒掃描奇數行(上場),然後再用後60分之一秒掃描偶數行(下場),兩者互補成完整的畫面。雖然掃描下場時,上場的亮度衰減了,但是由於亮暗的部分交織在一起,反而不易察覺。
使用隔行掃描可以讓每秒可以顯示更多的幀,每幀顯示更多圖像,使帶寬減少,隔行掃描提供完整的垂直細節,具有逐行掃描所需的相同帶寬,但具有兩倍的感知幀速率刷新率。與非隔行掃描的鏡頭(幀速率等於場速率)相比,這有效地使時間分辨率(也稱為時間分辨率)加倍。
無論是逐行掃描還是隔行掃描,都有視頻文件、傳輸和顯像三個概念,這三個概念相通但不相同。最早出現的是隔行掃描顯像,同時就配套產生了隔行傳輸,而隔行掃視頻文件是到數字視頻時代才出現的,其目的是為了兼容原有的隔行掃描體系(隔行掃描就是還依然在廣泛應用)。 [2] 

隔行掃描標識

格式標識符(如576i 50和720p 50)指定逐行掃描格式的幀速率,但對於隔行掃描格式,它們通常指定字段速率(幀速率的兩倍)。這可能會導致混淆,因為行業標準的SMPTE時間碼格式總是處理幀速率,而不是幀速率。為避免混淆,SMPTE和EBU總是使用幀速率來指定隔行格式,例如,480i 60是480i / 30,576i 50是576i / 25,1080i 50是1080i / 25。該慣例假設隔行掃描信號中的一個完整幀依次由兩個場組成。

隔行掃描好處

屏幕截圖,展示了去隔行掃描和隔行掃描圖像之間的區別。
模擬電視中最重要的因素之一是信號帶寬,以兆赫為單位。帶寬越大,整個生產和廣播鏈越昂貴,越複雜。這包括攝像機,存儲系統,廣播系統和接收系統:地面,有線,衞星,互聯網和最終用户顯示器(電視和計算機監視器)。
對於固定帶寬,隔行掃描為給定行數提供了兩倍顯示刷新率的視頻信號(與逐行掃描相比)視頻以類似的幀速率 - 例如1080i,每秒60幀半幀,而1080p每秒30幀全幀)。較高的刷新率改善了運動中物體的外觀,因為它更頻繁地更新其在顯示器上的位置,並且當物體靜止時,人類視覺組合來自多個相似半幀的信息以產生與所提供的相同的感知分辨率。通過漸進的全幀。如果源材料具有更高的刷新率,則此技術僅有用。電影電影通常以24fps記錄,因此不會受益於隔行掃描,這種解決方案可將最大視頻帶寬降低到5MHz而不會降低60Hz的有效圖像掃描速率。
給定固定帶寬和高刷新率,隔行掃描視頻還可以提供比逐行掃描更高的空間分辨率。例如,具有60 Hz場頻的1920×1080像素分辨率隔行掃描HDTV(稱為1080i60或1080i / 30)具有與具有60 Hz幀速率(720p60或720p / 60)的1280×720像素逐行掃描HDTV類似的帶寬。 ,但是對於低運動場景,空間分辨率大約是其兩倍。
但是,帶寬優勢僅適用於模擬或未壓縮的數字視頻信號。對於所有當前數字電視標準中使用的數字視頻壓縮,隔行掃描引入了額外的低效率。。EBU已經進行了測試,表明隔行掃描視頻相對於逐行掃描視頻的帶寬節省最小,即使幀速率提高了兩倍。即,1080p50信號產生與1080i50(又名1080i / 25)信號大致相同的比特率,和1080p50實際上需要較少的帶寬,以便在編碼“運動”時主觀上比1080i / 25(1080i50)等效更好。輸入“場景。
在VHS以及使用旋轉鼓在錄像帶上錄製視頻的大多數其他模擬視頻錄製方法都受益於隔行掃描。在VHS上,鼓每幀轉動一整圈,並帶有兩個圖像頭,每個圖像頭在每次旋轉時掃描一次磁帶表面。如果設備用於記錄逐行掃描視頻,則磁頭的切換將落在圖像的中間並顯示為水平頻帶。隔行掃描允許切換髮生在圖像的頂部和底部,標準電視機中的區域對於觀看者是不可見的。該設備也可以比每次掃描記錄全幀時更緊湊,因為這需要雙倍直徑的鼓以角速度的一半旋轉,並在磁帶上進行更長,更淺的掃描以補償每次掃描的雙倍線數。然而,相同的圖像區域,基本上將垂直分辨率減半,直到播放進行。另一種選擇是在實際停止磁帶之前按下暫停按鈕捕獲一個完整的幀(兩個字段),然後從幀緩衝區重複再現它。後一種方法可以產生更清晰的圖像,但是通常需要一定程度的去隔行以獲得顯着的視覺效果。雖然前一種方法會產生朝向圖像頂部和底部的水平偽影,因為磁頭不能沿着磁帶表面精確地穿過與在移動磁帶上記錄時完全相同的路徑,但這種不對準實際上會隨着逐行記錄而變差。
隔行掃描可用於製作3D電視節目,特別是對於CRT顯示器,尤其是對於彩色濾光眼鏡,通過在交替場中傳輸每隻眼睛的彩色鍵控圖像。這不需要對現有設備進行重大改動。快門眼鏡也可以採用,顯然需要實現同步。如果使用逐行掃描顯示來查看這種編程,則任何對圖像進行去隔行掃描的嘗試都會使效果無效。對於彩色濾光眼鏡,圖像必須是緩衝的並且顯示為具有交替的彩色鍵控線的漸進式,或者每個場必須被線性加倍並顯示為離散幀。後一種程序是在逐行顯示器上適合快門眼鏡的一種方法。

隔行掃描歷史

歷程
當開發電影膠片時,必須以高速率照亮電影屏幕以防止可見的閃爍。所需的確切速率因亮度而異 - 在昏暗的房間內可接受40 Hz,而對於延伸到周邊視覺的明亮顯示器,可能需要高達80 Hz。膠片解決方案是使用三葉片快門將每幀膠片投影三次:以每秒16幀的速度拍攝的電影每秒照亮屏幕48次。之後,當聲膜變得可用時,每秒24幀的更高投影速度使得雙葉片快門能夠產生每秒48次的照明 - 但僅限於投影儀無法以較低的速度投射。
此解決方案不能用於電視。要存儲完整的視頻幀並將其顯示兩次,需要幀緩衝器 -電子存儲器(RAM) - 足以存儲視頻幀。直到20世紀80年代後期,這種方法才變得可行。此外,避免工作室照明引起的屏幕干擾模式和真空管技術的限制要求以交流線路頻率掃描電視的CRT。(這在美國是60赫茲,50赫茲歐洲。)
在機械電視領域,LéonTheremin展示了隔行掃描的概念。他一直在開發一種基於鏡鼓的電視,從1925年的16行分辨率開始,然後是32行,最後在1926年使用隔行掃描64。作為他的論文的一部分,他在1926年5月7日電傳輸並投射近同步在五英尺見方的屏幕上移動圖像。
1930年,德國Telefunken工程師FritzSchröter首先制定了將單個視頻幀分解為隔行掃描線的概念並申請了專利。在美國,RCA工程師Randall C. Ballard在1932年獲得了同樣的想法。商業實施始於1934年,因為陰極射線管屏幕變得更亮,增加了由漸進(順序)引起的閃爍水平掃描。 [3] 
1936年,當英國制定模擬標準時,CRT只能在1/50秒內掃描大約200行。使用交錯,可以疊加一對202.5線場,以成為更清晰的405線框。垂直掃描頻率保持50 Hz,但可見細節明顯改善。結果,該系統取代了當時也使用的John Logie Baird的240線機械逐行掃描系統。 [3] 
從20世紀40年代開始,技術的進步使得美國和歐洲其他國家採用逐漸增加帶寬的系統來掃描更高的線數,並獲得更好的圖像。然而,隔行掃描的基本原理是所有這些系統的核心。美國採用稱為NTSC的525線路系統,歐洲採用625線路系統,英國從405線路系統切換到625線路,以避免開發獨特的彩色電視方法。法國從其獨特的819系統切換到625的更歐洲標準。雖然術語PAL通常用於描述電視系統的線路和幀標準,這實際上是不正確的,並且僅指在標準625線路廣播上疊加顏色信息的方法。法國採用了他們自己的SECAM系統,其他一些國家也採用了該系統,特別是俄羅斯及其衞星。PAL已被用於其他一些NTSC廣播,特別是在巴西。
直到20世紀70年代,當計算機監視器的需求導致重新引入逐行掃描時,隔行掃描無處不在。Interlace仍然用於大多數標準清晰度電視和1080iHDTV廣播標準,但不適用於LCD,微鏡(DLP)或大多數等離子顯示器;這些顯示器不使用光柵掃描來創建圖像,因此不能從隔行掃描中受益:實際上,它們必須用逐行掃描信號驅動。在去隔行從正常的隔行廣播電視信號獲得逐行掃描的電路可能增加使用這種顯示器的電視機的成本。當前漸進式顯示器在HDTV市場中占主導地位。
計算機為何不使用隔行掃描
在20世紀70年代,計算機和家庭視頻遊戲系統開始使用電視機作為顯示設備。此時,480線NTSC信號遠遠超出低成本計算機的圖形處理能力,因此這些系統使用簡化的視頻信號,使每個視頻場直接掃描在前一個視頻上,而不是兩條線之間的每條線。以前的字段。這標誌着自20世紀20年代以來從未見過的逐步掃描的迴歸。由於每場成了自己的,現代術語一個完整的框架將調用此240P的NTSC套,以及288P的PAL。雖然允許消費者設備創建此類信號,但廣播法規禁止電視台像這樣傳輸視頻。諸如CGA的計算機監視器標準進一步簡化為NTSC,其通過省略顏色調製來改善圖像質量,並允許計算機的圖形系統和CRT之間的更直接連接。
到20世紀80年代中期,計算機已超出這些視頻系統並需要更好的顯示器。的蘋果IIGS從使用舊的掃描方法的遭遇,具有最高的顯示分辨率為640X200,產生嚴重失真的高窄像素形狀,使得現實勻稱圖像的顯示困難。各公司的解決方案差異很大。由於PC監視器信號不需要廣播,因此它們消耗的帶寬遠遠超過NTSC和PAL信號所限制的6,7和8MHz帶寬。IBM的單色顯示適配器和增強型圖形適配器以及Hercules圖形卡和原始Macintosh計算機生成的視頻信號接近350p。所述准將Amiga的創建真正的隔行480i30 / 576i25RGB信號,適合於NTSC / PAL編碼。這種能力導致Amiga在視頻製作領域占主導地位直到20世紀90年代中期,但隔行掃描顯示模式導致需要單像素細節的更傳統PC應用的閃爍問題。1987年引入了VGA,很快就將PC標準化了,幾年後蘋果公司只推出了Mac標準,當VGA標準進行了改進,以匹配1987年推出的Apple專有的24位彩色視頻標準。
在20世紀80年代末和90年代初期,顯示器和顯卡製造商推出了新的高分辨率標準,再次包括隔行掃描。這些監視器以非常高的刷新率運行,意圖這將減輕閃爍問題。這種監視器非常不受歡迎。雖然起初閃爍並不明顯,但眼睛疲勞和缺乏焦點仍然是一個嚴重的問題。該行業很快就放棄了這種做法,在過去十年的剩餘時間裏,所有監督者都保證他們所聲明的決議是“非交錯的”。這種經驗就是為什麼至二十一世紀PC行業仍然反對高清電視的交錯,並遊説720p標準。此外,業界正在遊説超過720p,實際上是NTSC傳統國家的1080 / 60p,以及PAL傳統國家的1080 / 50p。

隔行掃描掃描區別

每一幀圖像由電子束順序地一行接着一行連續掃描而成,這種掃描方式稱為逐行掃描。把每一幀圖像通過兩場掃描完成則是隔行掃描,兩場掃描中,第一場(奇數場)只掃描奇數行,依次掃描1、3、5…行,而第二場(偶數場)只掃描偶數行,依次掃描2、4、6…行。隔行掃描技術在傳送信號帶寬不夠的情況下起了很大作用。

隔行掃描視頻文件

攝像機的採像,從一開始其實不存在掃描,因為無論是膠片還是電子原件都是同時受光的。但是,要讀取感光器上的信息(其核心任務將畫面採樣為YUV/RGB電信號),還是要靠掃描,於是讀取每個像素的順序就必須考慮。可以採取按順序依次讀取(逐行方式),也可以每行按順序讀取,但是先讀完所有奇數行再讀偶數行(隔行方式)。為了兼容電視機的隔行掃描體系,過帶機(將膠片上的畫面採樣為YUV/RGB電信號並保存在磁帶上的機器)和有些攝像機是隔行掃描制式的。當然也有逐行制式的產品。
當人們學會用電子原件感光和用數字化的計算機文件保存視頻時,數字攝像機就實用化了。事實上用數字信息保存的依然是YUV/RGB電信號,只是變換了個介質,本質上沒什麼區別(這裏指的是未壓縮的視頻,經過壓縮後就大不一樣了)。
但在計算機中,不管接到的是逐行還是隔行信號,都會按順序逐一寫入文件,不特別區分。如此一來,計算機上的視頻,以逐行和隔行信號為訊源的文件肯定有區別,它們分別稱為逐行掃描和隔行掃描視頻。 [4] 

隔行掃描交錯視頻

隨着全球流行的廣播電視的出現,製片人意識到他們需要的不僅僅是電視直播節目。便轉向電影、電視劇、新聞、短視頻等原創材料回放,然而低幀率視頻文件對於高幀率回放設備之間的幀速率刷新率)差異意味着簡單地將電影播放到電視攝像機中會閃爍。因此需要進行一些插幀或幀複製讓場同步(垂直同步),但是如果錄製的視頻文件幀率高於回放設備,只需要丟幀到廣播電視標準即可。
通常通過使用平滑(插值算法)而不是幀複製算法(例如3:2下拉等)來實現最佳結果,以調整電影和視頻幀速率之間的速度差異。
使用垂直同步防止屏幕撕裂時會出現類似問題,這是幀速率不匹配時遇到的另一個問題。

隔行掃描2:2下拉

在使用PAL或SECAM視頻標準的國家,用於電視的電影以每秒25幀的速度拍攝。PAL視頻標準以每秒25幀的速度播放,因此從電影到視頻的轉換很簡單;對於每個電影幀,捕獲一個視頻幀。
最初以24幀/秒拍攝的戲劇特徵以25幀/秒顯示。雖然在圖片中通常沒有注意到這一點(但是在動作速度期間可能會更加明顯,特別是如果拍攝的片段被拍下來),播放速度增加4%會導致音頻音調稍微明顯增加,僅超過0.679半音,這是有時使用音高變換器進行校正,儘管音高變換是最近的創新並取代了25幀/秒格式的替代電視電影方法。
2:2 pulldown也用於轉移節目和電影,以每秒30幀的速度拍攝,就像FriendsOklahoma!(1955年電影)到NTSC視頻,其具有60Hz的掃描速率。
雖然從PAL和SECAM電視的早期開始,4%的速度增加已經成為標準,但最近新技術已經普及,並且所得到的電視節目的速度和音調與原始電影的相同。
這種下拉方法有時用於將24幀/秒的材料轉換為25幀/秒。通常,這涉及到沒有上述4%加速的膠片到PAL傳輸。對於24幀/秒的電影,每25幀PAL視頻有24幀膠片。為了適應幀速率的這種不匹配,必須在50個PAL場上分配24幀膠片。這可以通過每12幀插入一個下拉場來實現,從而有效地在PAL視頻的25個場(或“12.5幀”)上傳播12幀膠片。使用的方法是2:2:2:2:2:2:2:2:2:2:2:3(歐元)下拉(見下文)。
這種方法源於對更快,更高音調的音軌的挫敗感,這些音軌傳統上伴隨着傳輸給PAL和SECAM觀眾的電影。一些電影開始以這種方式電視電影。它特別適用於配樂特別重要的電影。
當NTSC區域中的電視台播放使用PAL打印/版本但正在以NTSC格式廣播的電影或節目時,有時它們不執行適當的PAL到NTSC下拉轉換,或者它不正確地完成。由於PAL 576線路/ 50 Hz與NTSC 480線路/ 60 Hz格式的速率更快,因此程序會略微加速和/或聲音更高音調。
一些DVD版本的電視節目/電影,如The Archie Show,其劇集以NTSC格式播出,但大師們在使用時丟失或損壞,使用PAL 576/50打印,3:2下拉尚未播出正確執行,導致更快的膠片速度和更高的音高。雖然幾集中的一些場景使用NTSC鏡頭,因為PAL母版丟失,並且鏡頭在使用中受損,導致速度,音高和膠片質量的變化。

隔行掃描2:3下拉

在美國和其他電視使用59.94 Hz垂直掃描頻率的國家,視頻以29.97幀/秒的速度播出。為了在視頻信號上精確地呈現電影的運動,電視電影必須使用稱為2:3下拉的技術,也稱為3:2下拉,以從24轉換為29.97幀/秒。
術語“下拉”來自在傳送機構的薄膜部分內向下“拉動”(物理移動)薄膜的機械過程,以重複的速率(標稱為24幀/秒)將薄膜從一幀推進到下一幀。 。這分兩步完成。第一步是將膠片運動減慢1/1000至23.976幀/秒。觀察者察覺不到速度的差異。對於一部兩小時的電影,播放時間延長了7.2秒。
2:3下拉的第二步是將電影幀分配到視頻場中。在23.976幀/秒時,每5幀29.97幀/秒視頻有4幀膠片:
23.97/29.97=5/4
通過利用60Hz視頻的隔行特性,這四個幀被“拉伸”為五個。對於每一幀,實際上存在兩個不完整的圖像或,一個用於圖像的奇數行,一個用於偶數行。有,因此,對於每四個膠片幀,這是所謂的十個字段Ç,和d。電視電影交替地將A幀放置在兩個場中,B幀跨越三個場,C幀跨越兩個場,D幀跨越三個場。這可以寫成AABBBCCDDD或2-3-2-3或簡單地2-3。在四個膠片幀曝光後,循環完全重複:
3:2模式與上面所示模式相同,只是它移動了一幀。例如,以膠片幀B開始的循環產生3:2模式:BBBCCDDDAA或3-2-3-2或簡單地3-2。換句話説,2-3和3-2模式之間沒有區別。實際上,“3-2”符號具有誤導性,因為根據SMPTE標準,每個四幀電影序列的第一幀被掃描兩次,而不是三次。
上述方法是“經典”2:3,它在幀緩衝區允許保持多於一幀之前使用。執行2:3的首選方法每五個中只創建一個髒幀(即3:3:2:2或2:3:3:2或2:2:3:3);雖然這種方法有更多的抖動,但它允許更容易的上轉換(丟棄髒幀而不丟失信息)和編碼時更好的整體壓縮。松下DVX-100B攝像機支持2:3:3:2模式,名稱為“Advanced Pulldown”。請注意,只顯示字段 - 沒有幀,因此沒有偽幀 - 在隔行顯示中,例如在CRT上。在顯示隔行掃描視頻的其他方法中可能出現偽幀 [3] 

隔行掃描其他下拉模式

對於以低於24幀/秒的“靜音速度”拍攝的電影必須使用類似的技術,其中包括家庭電影格式(標準8毫米膠片的標準是16 fps,以及Super 8 mm膠片的18 fps)以及無聲電影(35毫米格式通常為16 fps,12 fps,甚至更低)。
  • 16幀/秒(實際為15.985)到NTSC 30幀/秒(實際為29.97):下拉應為3:4:4:4
  • 16幀/秒到PAL 25:下拉應為3:3:3:3:3:3:3:4(更好的選擇是以16.67幀/秒的速度運行電影,將下拉簡化為3:3)
  • 18幀/秒(實際為17.982)到NTSC 30:下拉應為3:3:4
  • 20幀/秒(實際為19.980)到NTSC 30:下拉應為3:3
  • 27.5幀/秒到NTSC 30:下拉應為3:2:2:2:2
  • 27.5幀/秒到PAL 25:下拉應為1:2:2:2:2
此外,已經描述了其他模式,其涉及在逐行顯示器(例如,LCD或等離子體)上顯示24幀/秒視頻(例如,來自DVD播放器)所需的逐行幀速率轉換:
  • 24幀/秒至96幀/秒(4倍幀重複):下拉為4:4
  • 24幀/秒至120幀/秒(5倍幀重複):下拉為5:5
  • 24幀/秒到120幀/秒(3:2下拉,然後是2倍去隔行):下拉是6:4

隔行掃描反交錯

有交錯就有反交錯。所有隔行掃描視頻在計算機播放都進行反交錯,只有那些自帶反交錯的電視才不需要這麼做。
有幾種去隔行掃描方法。

隔行掃描場組合去隔行

場組合去隔行,將偶數場和奇數場組合成一幀。這將感知的幀速率(時間分辨率)減半,從而將 50i 或 60i 轉換為 25p 或 30p。
  • 編織Weave通過將連續的字段添加在一起來完成編織。當圖像在字段之間沒有改變時,這很好,但是當一幀中的像素與另一幀中的像素不對齊,形成鋸齒狀邊緣時,任何改變都將導致稱為“梳理”的偽像。該技術以時間分辨率(運動)的一半為代價保留了完整的垂直分辨率。
  • 混合(Blending)是通過完成共混,或平均連續的場被顯示為一幀。避免梳理,因為圖像在彼此之上。這樣就會留下一種稱為鬼影的偽像。圖像失去垂直分辨率和時間分辨率。這通常與垂直調整大小相結合,因此輸出在垂直分辨率上沒有數值損失。這樣做的問題在於存在質量損失,因為圖像已經縮小然後增大。這種細節損失使圖像看起來更柔和。由於兩個運動場組合成一個幀,因此混合也會丟失一半的時間分辨率。
  • 選擇性混合(Selective blending),或智能混合運動自適應混合,是編織和混合的組合。由於幀之間沒有變化的區域不需要任何處理,所以框架是編織的,只有需要它的區域被混合。這保留了完整的垂直分辨率和一半的時間分辨率,並且由於兩種技術的選擇性組合,它具有比編織或混合更少的偽像。
  • 反向電視電影(IVTC、Inverse Telecine):電視電影用於將運動圖像源以每秒24幀的速度轉換為使用NTSC視頻系統,每秒30幀的隔行掃描電視視頻。以每秒25幀的速度使用PAL的國家不使用電視電影,因為運動圖像源加速4%以達到每秒所需的25幀。如果使用Telecine,則可以反轉算法以獲得具有較慢幀速率的原始非隔行掃描素材。為了使其工作,必須知道或猜測確切的電視電影模式。與大多數其他去隔行方法不同,當它工作時,反轉電視電影可以恢復原始的逐行掃描視頻流。
  • Telecide風格的算法:如果隔行掃描的鏡頭是以較慢的幀速率(例如“卡通下拉”)從漸進幀生成的,則可以通過從匹配的上一幀/下一幀複製丟失的場來恢復精確的原始幀。在沒有匹配的情況下(例如,具有提升的幀速率的簡短卡通序列),則濾波器回退到另一種去隔行方法,例如混合或行加倍。這意味着Telecide的最壞情況是偶爾出現重影或降低分辨率的幀。相比之下,當更復雜的運動檢測算法失敗時,它們可能會引入對原始材料不忠的像素偽像。對於電視電影視頻,抽取可以作為後處理應用以降低幀速率,並且這種組合通常比簡單的反轉電視電影更穩健,當不同的隔行掃描的素材被拼接在一起時,它會失敗。 [3] 

隔行掃描場擴展去隔行

  • 這些方法取每一場(只有一半的行)並將其擴展到整個屏幕以製作一個框架。這可能會使圖像的垂直分辨率減半,但旨在保持原始場速率(50i 或 60i 轉換為 50p 或 60p)。
半尺寸顯示每個隔行掃描場本身,導致視頻的原始垂直分辨率的一半,未縮放。雖然這種方法保留了所有垂直分辨率和所有時間分辨率,但由於其假長寬比,因此可以理解地不用於常規觀看。然而,它可以成功地用於應用期望非交錯幀的視頻濾波器,例如利用來自相鄰像素的信息的那些(例如,鋭化)。
線加倍
線加倍取每個交錯場的線(僅由偶數或奇數線組成)並使它們加倍,填充整個幀。這導致視頻具有與場速率相同的幀速率,但是每個幀具有垂直分辨率的一半,或者分辨率等於構成幀的每個場的分辨率。線倍增可防止梳狀偽影,但會導致圖像質量明顯降低,因為顯示的每幀都加倍,實際上僅在原始半場分辨率下。這在靜止物體上很明顯,因為它們看起來像是上下襬動。這些技術也稱為bob去隔行線性去隔行出於這樣的原因。線倍增保留了水平和時間分辨率,但犧牲了垂直分辨率和靜止和較慢移動物體上的浮雕偽影。該方法的變體丟棄每幀中的一個場,使時間分辨率減半。
線加倍有時與一般的去隔行或插值(圖像縮放)相混淆,插值使用空間濾波來產生額外的線,從而降低像素化在任何類型的顯示器上的可見性。術語“line doubler”在高端消費電子產品中使用得更頻繁,而“去隔行”則更頻繁地用於計算機和數字視頻領域。

隔行掃描動作檢測

通過結合傳統的場組合方法(編織和混合)和幀擴展方法(bob或線加倍)來創建高質量的逐行視頻序列,可以確保最佳圖像質量;最好的算法也會嘗試預測後續子場之間的圖像運動的方向和數量,以便更好地將兩個子場混合在一起。
方向和運動量的基本提示之一是隔行掃描信號中的梳狀偽像的方向和長度。更高級的實現將採用類似於視頻壓縮中使用的塊運動補償的算法;使用這種技術的去隔行掃描儀通常更優越,因為它們可以使用來自許多領域的信息,而不是僅僅一兩個。這需要強大的硬件來實現實時操作。
例如,如果兩個字段的人臉朝左移動,則編織將創建梳理,並且混合會產生重影。高級運動補償(理想情況下)會看到幾個場中的臉部是相同的圖像,只是移動到不同的位置,並試圖檢測這種運動的方向和數量。然後,算法將嘗試通過將圖像組合在一起來重建兩個輸出幀中的面部的全部細節,沿着檢測到的方向移動每個子場的部分移動檢測到的移動量。
運動補償需要與場景變化檢測相結合,否則它將嘗試在兩個完全不同的場景之間找到運動。實現不良的運動補償算法會干擾自然運動並且可能導致視覺偽像,其表現為應該是靜止或平滑運動圖像的“跳躍”部分 [2] 
參考資料
  • 1.    杜志輝. 紅外熱像儀隔行掃描原理及其公式的推導[J]. 紅外技術, 1993(3):11-14.
  • 2.    趙司井, 林宏剛. 動態分塊隔行掃描算法設計與實現[J]. 成都信息工程學院學報, 2014, 29(6):630-634.
  • 3.    RW燒傷,電視:形成年的國際歷史,IET,1998,p。425.ISBN978-0-85296-914-4。
  • 4.    鄭南寧, 楊柳, 徐維樸,等. 一種數字化處理電視隔行掃描格式轉換的實現方法: CN, CN1479517[P]. 2004.