複製鏈接
請複製以下鏈接發送給好友

頂點着色單元

鎖定
頂點着色單元是顯示芯片內部用來處理頂點(Vertex)信息並完成着色工作的並行處理單元。頂點着色單元決定了顯卡的三角形處理和生成能力,所以也是衡量顯示芯片性能特別是3D性能的重要參數。
中文名
頂點着色單元
外文名
Vertex shader unit
應    用
R520,GeforceFX,8條渲染管道
用    途
決定顯卡的三角形處理生成能力
衡    量
3D性能的重要參數
決    定
顯卡的三角形處理和生成能力

頂點着色單元簡介

頂點着色單元 頂點着色單元
頂點(Vertex)是圖形學中的最基本元素,在三維空間中,每個頂點都擁有自己的座標和顏色值等參數,三個頂點可以構成成一個三角形,而顯卡所最終生成的立體畫面則是由數量繁多的三角形構成的,而三角形數量的多少就決定了畫面質量的高低,畫面越真實越精美,就越需要數量更多的三角形來構成。頂點着色單元就是處理這些信息然後再送給像素渲染單元完成最後的貼圖工作,最後再輸出到顯示器就成為我們所看到的3D畫面。而顯卡頂點處理能力不足,就會導致要麼降低畫質,要麼降低速度。
在相同的顯示核心下,頂點着色單元的數量就決定了顯卡的性能高低,數量越多也就意味着性能越高,例如具有6個頂點着色單元的GeForce 6800GT就要比只具有5個頂點着色單元的GeForce 6800性能高:但在不同的顯示核心架構下頂點着色單元的數量多則並不一定就意味着性能越高,這還要取決於頂點着色單元的效率以及顯卡的其它參數,例如具有4個頂點着色單元的Radeon 9800Pro其性能還不如只具有3個頂點着色單元的GeForce 6600GT

頂點着色單元與渲染管線的區別

頂點着色單元 頂點着色單元
渲染管線也稱為渲染流水線,是顯示芯片內部處理圖形信號相互獨立的的並行處理單元渲染管線的數量一般是以 像素渲染流水線的數量×每管線的紋理單元數量 來表示渲染管線的數量是決定顯示芯片性能和檔次的最重要的參數之一,在相同的顯卡核心頻率下,更多的渲染管線也就意味着更大的像素填充率紋理填充率

頂點着色單元應用

ATi R520
R520,Radeon X1800將內建8個頂點着色單元。ATi上一代產品集成6個頂點着色單元,但是頂點數據從來不是整體性能的瓶頸。唯一受制於頂點着色的遊戲是3DMARK05,其它所有遊戲都受制於顯示卡的像素着色性能。
頂點着色單元 頂點着色單元
已經説過多次,R520內建16條像素着色流水線,ATi喜歡稱作是16條像素着色處理器。
R520可以處理16個紋理,因為它有16個紋理單元。在1個時鐘週期內,可以渲染16個Render Back ends。
R520可以比較16個Z比較單元,在優化Z信息方面非常有用處。
R520是1個非常有可編程性的芯片,你可以在這個GPU上處理多達512個線程,這意味着,2個R520協同可以同時處理1024線程。Intel和ATi相信,這樣的線程編程性將給雙R520用户更多的性能提升。
Geforce FX
Geforce FX圖形芯片支持AGP8x,系統處理器的頂點數據都是通過顯示卡的AGP總線傳輸到圖形芯片,進行渲染的過程,因此理論上來説,AGP總線的帶寬越大,通過的頂點數據量也就越多,進而加速圖形芯片的渲染過程。但是在實際應用當中,還沒有任何程序可以讓AGP總線的數據傳輸處於滿負荷狀態,相對於AGP4x來説,AGP8x對圖形芯片效能提升還無法做出什麼貢獻來,nVIDIA宣稱向GPU傳輸多股HDTV數據流可以讓2.1GB/s的AGP8x總線處於滿負荷的狀態。
為了滿足微軟DirectX 9.0對3D圖形芯片的要求,nVIDIA重新設計了Geforce FX內核頂點着色引擎電路。nVIDIA之前的Geforce4 Ti內核集成了2個頂點着色單元,這次的Geforce FX圖形芯片內核集成單頂點着色管線,由多個浮點處理器組成的巨型並行列隊組成。nVIDIA的這種設計類似於3DLabs P10圖形芯片採用的頂點着色架構,不過還不清楚Geforce FX內核單頂點着色管線由多少獨立的處理單元並行工作。
這些並行的浮點頂點處理單元具備專用的多線程指令集,並且nVIDIA對這些指令集進行了優化,最大限度地提升了圖形芯片的三角形吞吐量。nVIDIA宣稱Geforce FX的三角形生成速率達到了每秒3億7千5百萬個,稍微超過ATi Radeon 9700 Pro的三角形生成速率。不過,Geforce FX圖形芯片的工作頻率也要比Radeon 9700 Pro高出很多。
藉助Geforce FX內核集成的這種頂點着色架構,nVIDIA宣佈Geforce FX支持DirectX 9.0當中2.0版本的頂點着色技術規範。實際上Geforce FX圖形芯片在許多方面已經超越了DirectX 9.0 2.0版本的頂點着色技術規範。Geforce FX圖形芯片能夠以比2.0版本VS更多的指令、更多的常數、更多的循環來處理頂點着色程序,在這方面,Geforce FX要強過ATi的Radeon 9700 Pro圖形芯片,Radeon 9700 Pro圖形芯片只支持到2.0版本的頂點着色技術規範。Geforce FX芯片在硬件層面上也集成了更多的寄存器,來支持超越2.0版本的頂點着色功能。
顯然,Geforce FX已經支持到了DirectX 9.0 2.0版本的頂點着色技術規範制定的所有標準。不過未來一年當中的遊戲可能還無法完全發揮Geforce FX在像素和頂點着色方面的優勢。即便是2003年即將上市的設計遊戲大作DOOM 3,大部分也是基於DirectX 8平台進行開發。充分使用到Geforce FX複雜的頂點像素着色功能的遊戲,可能要到2003年下半年末期才能出現。因此,單從紙面參數上來看,Geforce FX的效能要強過Radeon 9700 Pro不少,但是就遊戲來説,Geforce FX強大的技術規格並不能立即轉化成遊戲效能的提升
8條渲染管道
大多數完全支持微軟DirectX 9.0的3D圖形芯片都會集成8條像素渲染管線,如ATi之前推出的Radeon 9700 Pro,這次Geforce FX圖形芯片也不例外,在內核當中集成了8條128-bit完全浮點化的像素渲染管線。
這8條像素渲染管線耗費了Geforce FX大部分新增加的晶體管,也就是這8條像素渲染管線,使得電影級別的畫質和效果得以實現。和Radeon 9700 Pro一樣,Geforce FX圖形芯片在單週期當中,每條渲染管線只能處理一個紋理,因此和Radeon 9700 Pro相比,Geforce FX在填充率方面不具優勢,因此nVIDIA在Geforce FX的顯存控制部分下了功夫,來彌補渲染管線在紋理處理方面的不足,另外更高的主頻速度和整體較高的效率也參加了彌補的工作。和Radeon 9700 Pro一樣,Geforce FX對單像素最多可以處理16個紋理。
在像素着色方面,Geforce FX再次超前,其像素處理單元不僅僅符合微軟DirectX 9.0 2.0版本的像素着色技術規範的規定,更是超越了2.0版本的像素着色技術規範,為用户提供了Pixel Shader 2.0+的技術功能,具體體現在為着色程序提供更多的指令上。
這裏,我們看到要完全發揮Geforce FX的像素着色功力的話,還要等上1年的時間。另外,Geforce FX支持的色彩精度也大大超過競爭對手。