反饋

OpenCL

OpenCL（全稱：Open Computing Language，開放計算語言）是一種開放的、免版税的標準，用於超級計算機、雲服務器、個人計算機、移動設備和嵌入式平台中各種加速器的跨平台並行編程。OpenCL極大地提高了眾多市場類別中廣泛應用程序的速度和響應能力，包括專業創意工具、科學和醫療軟件、視覺處理以及神經網絡訓練和推理。^[3]

中文名: 開放運算語言

外文名: OpenCL
所屬學科: 計算機科學

OpenCL歷史發展

OpenCL最初蘋果公司開發，擁有其商標權，並在與AMD，IBM，英特爾和NVIDIA技術團隊的合作之下初步完善。隨後，蘋果將這一草案提交至Khronos Group。

2008年6月的WWDC大會上，蘋果提出了OpenCL規範，旨在提供一個通用的開放API，在此基礎上開發GPU通用計算軟件。隨後，Khronos Group宣佈成立GPU通用計算開放行業標準工作組，以蘋果的提案為基礎創立OpenCL行業規範。5個月後的2008年11月18日，該工作組完成了OpenCL 1.0規範的技術細節。2010年6月14日，OpenCL 1.1 發佈。2011年11月15日，OpenCL 1.2 發佈。2013年11月19日，OpenCL 2.0發佈。^[1]

OpenCL語言特點

OpenCL是一個為異構平台編寫程序的框架，此異構平台可由CPU，GPU或其他類型的處理器組成。OpenCL由一門用於編寫kernels （在OpenCL設備上運行的函數）的語言（基於C99）和一組用於定義並控制平台的API組成。OpenCL提供了基於任務分割和數據分割的並行計算機制。

OpenCL類似於另外兩個開放的工業標準OpenGL和OpenAL，這兩個標準分別用於三維圖形和計算機音頻方面。OpenCL擴展了GPU用於圖形生成之外的能力。OpenCL由非盈利性技術組織Khronos Group掌管。^[1]

OpenCL支持現狀

2009年6月NVIDIA首家發佈了支持OpenCL 1.0通用計算規範的驅動程序，支持Windows和Linux操作系統。

2009年8月初AMD首次發佈了可支持IA處理器(x86和amd64/x64)的OpenCL SDK——ATI Stream SDK v2.0Beta，立即交由業界標準組織KHRONOS進行審核。該SDK更名為AMD APP SDK。

2012年2月，intel發佈了The Intel® SDK for OpenCL* Applications 2012，支持OpenCL 1.1基於帶HD4000/2500的顯示核心的第三代酷睿CPU（i3,i5,i7）和GPU。

2013年6月，intel發佈了第四代酷睿CPU haswell 其內置的HD4600/4400/4200 Iris（鋭矩）5000/5100/pro 5200（自帶eDRAM緩存）支持OpenCL 1.2（未來可能升級到OpenCL 2.0）

NVIDIA顯卡方面 Geforce 8000\9000\100、GTX200-1000，RTX2000均支持OpenCL 1.0-1.2

AMD顯卡方面 Radeon HD 4000-7000\Rx 200\Rx 300\RX 400-500/Fury系列，Vega系列均支持OpenCL 1.0-1.2，除Radeon HD4000-6000系列外，其餘均會支持OpenCL 2.0

移動平台方面高通adreno320/330/400系列/500系列提供了Android上的OpenCL1.2或者2.0支持，NVIDIA的Tegra K1也提供了OpenCL 支持。

OpenCL組織成員

OpenCL工作組的成員包括：3Dlabs、AMD、蘋果、ARM、Codeplay、愛立信、飛思卡爾、華為、HSA基金會、GraphicRemedy、IBM、Imagination Technologies、Intel、諾基亞、NVIDIA、摩托羅拉、QNX、高通，三星、Seaweed、德州儀器、布里斯托爾大學、瑞典Ume大學。

像Intel、NVIDIA和AMD都是這個標準的支持者，不過微軟並不在其列。^[2]

OpenCL使用介紹

NVIDIA顯卡對OpenCL技術支持得比較到位，所以這裏僅用NVIDIA的Geforce（精視）系列顯卡作解釋。

中國用户可以登錄英偉達中文官方網站上下載到最新的驅動程序，只要下載的驅動是195.62版本或更高，就可以在Geforce（精視）8系列或更高級的顯卡中開啓OpenCL，在安裝好新版本的顯卡驅動程序並重新啓動後，OpenCL就自動開啓了。當有需要使用CPU來完成的工作如轉換視頻時，GPU就會幫助CPU進行運算，以提高轉換速度。但是在3D遊戲中應該是不會調用OpenCL的，因為顯卡有自己的硬件加速功能以及物理引擎，所以Geforce（精視）8系列及以上的顯卡就不需要CPU輔助進行渲染了。這時候，就可以一邊玩遊戲，一邊進行消耗CPU的工作了。

當然同樣，在NVIDIA的Quadro系列專業顯卡中，同樣能夠使用OpenCL技術。只要顯卡能夠達到CUDA的要求，就能夠正常使用OpenCL，以獲得優異的CPU運算效率。

在AMD-ATI的Stream技術中（現已經改名為AMD APP並行加速技術），已經為日常使用、辦公、遊戲等提供物理加速。基於OpenCL標準開發，其中，ATI Radeon HD 4000-5000、AMD Radeon HD 6000系列同時支持ATI Stream和AMD APP（由於Stream基於CAL和Brook+語言開發，更適合VLIW5和VLIW4這樣的SIMD架構），AMD Radeon HD7000和Radeon Rx 200系列支持AMD APP，運算效率較老架構提升十分明顯。

OpenCL 1.0

OpenCL 1.0主要由一個並行計算API和一種針對此類計算的編程語言組成，此外還特別定義了：

1、C99編程語言並行擴展子集;

2、適用於各種類型異構處理器的座標數據和基於任務並行計算API;

3、基於IEEE 754標準的數字條件;

4、與OpenGL、OpenGL ES和其他圖形類API高效互通。

OpenCL 1.1

Khronos Group2010年6月15日宣佈，OpenCL通用計算標準的1.1版本已經發放，開發者可以免費下載，並依照新標準開始進行編程。

OpenCL 1.1標準向下兼容1.0版，提供了更多的新功能，並對性能進行了改善。主要新特性包括：

- 支持新數據類型，如3維矢量和新增圖像格式。

- 支持處理多Host指令以及跨設備Buffer處理。

- Buffer區域操作，包括對1D、2D、3D三角形區域的讀、寫和拷貝操作。

- 改進驅動和控制指令執行的事件應用。

- 增加OpenCL內建C功能。

- 通過鏈接OpenCL和OpenGL事件，高效共享圖像和Buffer，改進與OpenGL的互操作性。

OpenCL標準由Khronos Group的OpenCL工作組制定，完全開放，任何開發者都可免費使用。OpenCL工作組成員包括（英文首字母排序）：3DLABS、動視暴雪、AMD、蘋果、ARM、Broadcom、CodePlay、EA、愛立信、飛思卡爾、富士通、通用電氣、GraphicRemedy、HI、IBM、Intel、Imagination Technologies、美國Los Alamos國家實驗室、摩托羅拉、Movidia、諾基亞、NVIDIA、Petapath、QNX、高通、RapidMind、三星、Seaweed、S3、意法半導體、Takumi、德州儀器、東芝和Vivante。

OpenCL 2.0

Khronos Group2013年11月19日宣佈了OpenCL通用計算標準的2.0版本特性，其中對共享虛擬內存的支持是一大亮點（此前NVIDIA發佈了CUDA 6規範也同樣支持共享虛擬內存，僅限Kepler和Maxwell架構的N卡。此外，AMD的GCN架構顯卡同樣支持。AMD的Kaveri APU支持HSA異構計算和hUMA統一物理尋址，較虛擬共享更加先進。）

1、共享虛擬內存

主機和設備內核可以直接共享複雜的、包含指針的數據結構，大大提高編程靈活性，避免冗餘的數據轉移。

2、動態並行

設備內核可以在無需主機交互的情況下進行內核排隊，實現靈活的工作調度，避免數據轉移，大大減輕主處理器的負擔。

3、通用內存空間

無需指定地址空間名稱即可為引數(argument)編寫函數，不用再為程序裏的每一個地址空間名稱編寫函數。

4、圖像

改進圖像支持，包括sRGB、3D，內核可以讀寫同一圖像。

5、C11原子操作

新的C11原子和同步操作子集，分配在同一工作組內

6、Pipes

以FIFO格式組織數據的內存對象，可以直接讀寫，數據結構可簡單編程、高度優化。

7、安卓可安裝客户端驅動擴展

安卓系統上可將OpenCL作為共享對象進行載入。^[1]

OpenCL框架組成

OpenCL平台API：平台API定義了宿主機程序發現OpenCL設備所用的函數以及這些函數的功能，另外還定義了為OpenCL應用創建上下文的函數。

OpenCL運行時API：這個API管理上下文來創建命令隊列以及運行時發生的其他操作。例如，將命令提交到命令隊列的函數就來自OpenCL運行時API。

OpenCL編程語言：這是用來編寫內核代碼的編程語言。它基於ISO C99標準的一個擴展子集，因此通常稱為OpenCL C編程語言。

把上述單獨的部分彙集起來，形成OpenCL的一個全景圖，如圖《OpenCL全景圖》所示：

首先是一個定義上下文的宿主機程序。如上圖中中的上下文包含兩個OpenCL設備、一個CPU和一個GPU。接下來定義了命令隊列。這裏有兩個隊列，一個是面向GPU的有序命令隊列，另一個是面向CPU的亂序命令隊列。然後宿主機程序定義一個程序對象，這個程序對象編譯後將為兩個OpenCL設備（CPU和GPU）生成內核。接下來宿主機程序定義程序所需的內存對象，並把它們映射到內核的參數。最後，宿主機程序將命令放入命令隊列來執行這些內核。^[1]

OpenCL全景圖

參考資料

1. The Khronos Group Releases OpenCL 1.0 Specification . Khronos Group. 2008-12-08
2. OpenCL gets touted in Texas. MacWorld. 2008-11-20
3. OpenCL Overview - The Khronos Group Inc ．khronos．2020-01-05[引用日期2023-05-21]

OpenCL的概述圖（1張）

詞條統計

瀏覽次數：次
編輯次數：43次歷史版本
最近更新：愛上少女时代（2023-05-21）

1 歷史發展
2 語言特點
3 支持現狀
4 組織成員
5 使用介紹
6 框架組成