複製鏈接
請複製以下鏈接發送給好友

張量處理器

鎖定
張量處理器(英語:tensor processing unit,縮寫:TPU)是Google機器學習定製的專用芯片(ASIC),專為Google的深度學習框架TensorFlow而設計。
中文名
張量處理器
外文名
tensor processing unit

張量處理器簡介

張量處理器(英語:tensor processing unit,縮寫:TPU)是Google機器學習定製的專用芯片(ASIC),專為Google的深度學習框架TensorFlow而設計。
圖形處理器(GPU)相比,TPU採用低精度(8位)計算,以降低每步操作使用的晶體管數量。降低精度對於深度學習的準確度影響很小,但卻可以大幅降低功耗、加快運算速度。同時,TPU使用了脈動陣列的設計,用來優化矩陣乘法卷積運算,減少I/O操作。此外,TPU還採用了更大的片上內存,以此減少對DRAM的訪問,從而更大程度地提升性能。
Google在2016年的Google I/O年會上首次公佈了TPU。不過在此之前TPU已在Google內部的一些項目中使用了一年多,如Google街景服務、RankBrain以及其旗下DeepMind公司的圍棋軟件AlphaGo等都用到了TPU。而在2017年的Google I/O年會上,Google又公佈了第二代TPU,並將其部署在Google雲平台之上。第二代TPU的浮點運算能力高達每秒180萬億次。 [1] 

張量處理器世代

張量處理器第一代

第一代的TPU使用8-bit矩陣乘法引擎,透過PCIe3.0與CISC指令操作。芯片為28nm製程,die≤ 331 mm,700 Mhz,功耗在28至40瓦。

張量處理器第二代

第二代於2017年五月發表。

張量處理器第三代

第三代於2018年五月發表。 [1] 

張量處理器專用集成電路

專用集成電路(英語:Application-specific integrated circuit縮寫ASIC),是指依產品需求不同而客製化的特殊規格集成電路;相反地,非客製化的是應用特定標準產品(Application-specific standard product)集成電路。
專用集成電路是由特定使用者要求和特定電子系統的需要而設計、製造。由於單個專用集成電路芯片的生產成本很高,如果出貨量較小,則採用專用集成電路在經濟上不太實惠。這種情況可以使用可編程邏輯器件(如現場可編程邏輯門陣列)來作為目標硬件實現集成電路設計。此外,可編程邏輯器件具有用户可編程特性,因此適合於大規模芯片量產之前的原型機,來進行調試等工作。但是可編程邏輯器件在面積、速度方面的優化程度不如全定製的集成電路。
一般專用集成電路的ROMRAM都在出廠前經過掩膜(MASK),如常用的紅外線遙控器發射芯片就是這種芯片。
專用集成電路的特點是面向特定用户的需求,品種多、批量少,要求設計和生產週期短,它作為集成電路技術與特定用户的整機或系統技術緊密結合的產物,與通用集成電路相比具有體積更小、重量更輕、功耗更低、可靠性提高、性能提高、保密性增強、成本降低等優點。 [1] 
參考資料
  • 1.    Jouppi, Norm. Google supercharges machine learning tasks with TPU custom chip. Google Cloud Platform Blog. Google. May 18, 2016 [2017-01-22]