反饋

張量處理器

張量處理器（英語：tensor processing unit，縮寫：TPU）是Google為機器學習定製的專用芯片（ASIC），專為Google的深度學習框架TensorFlow而設計。

中文名: 張量處理器

外文名: tensor processing unit

張量處理器簡介

張量處理器（英語：tensor processing unit，縮寫：TPU）是Google為機器學習定製的專用芯片（ASIC），專為Google的深度學習框架TensorFlow而設計。

與圖形處理器（GPU）相比，TPU採用低精度（8位）計算，以降低每步操作使用的晶體管數量。降低精度對於深度學習的準確度影響很小，但卻可以大幅降低功耗、加快運算速度。同時，TPU使用了脈動陣列的設計，用來優化矩陣乘法與卷積運算，減少I/O操作。此外，TPU還採用了更大的片上內存，以此減少對DRAM的訪問，從而更大程度地提升性能。

Google在2016年的Google I/O年會上首次公佈了TPU。不過在此之前TPU已在Google內部的一些項目中使用了一年多，如Google街景服務、RankBrain以及其旗下DeepMind公司的圍棋軟件AlphaGo等都用到了TPU。而在2017年的Google I/O年會上，Google又公佈了第二代TPU，並將其部署在Google雲平台之上。第二代TPU的浮點運算能力高達每秒180萬億次。^[1]

張量處理器世代

張量處理器第一代

第一代的TPU使用8-bit矩陣乘法引擎，透過PCIe3.0與CISC指令操作。芯片為28nm製程，die≤ 331 mm，700 Mhz，功耗在28至40瓦。

張量處理器第二代

第二代於2017年五月發表。

張量處理器第三代

第三代於2018年五月發表。^[1]

張量處理器專用集成電路

專用集成電路（英語：Application-specific integrated circuit，縮寫：ASIC），是指依產品需求不同而客製化的特殊規格集成電路；相反地，非客製化的是應用特定標準產品（Application-specific standard product）集成電路。

專用集成電路是由特定使用者要求和特定電子系統的需要而設計、製造。由於單個專用集成電路芯片的生產成本很高，如果出貨量較小，則採用專用集成電路在經濟上不太實惠。這種情況可以使用可編程邏輯器件（如現場可編程邏輯門陣列）來作為目標硬件實現集成電路設計。此外，可編程邏輯器件具有用户可編程特性，因此適合於大規模芯片量產之前的原型機，來進行調試等工作。但是可編程邏輯器件在面積、速度方面的優化程度不如全定製的集成電路。

一般專用集成電路的ROM和RAM都在出廠前經過掩膜（MASK），如常用的紅外線遙控器發射芯片就是這種芯片。

專用集成電路的特點是面向特定用户的需求，品種多、批量少，要求設計和生產週期短，它作為集成電路技術與特定用户的整機或系統技術緊密結合的產物，與通用集成電路相比具有體積更小、重量更輕、功耗更低、可靠性提高、性能提高、保密性增強、成本降低等優點。^[1]

參考資料

1. Jouppi, Norm. Google supercharges machine learning tasks with TPU custom chip. Google Cloud Platform Blog. Google. May 18, 2016 [2017-01-22]

張量處理器的概述圖（1張）

詞條統計

瀏覽次數：次
編輯次數：5次歷史版本
最近更新： Good丶Hao （2023-01-10）

1 簡介
2 世代: 2.1 第一代; 2.2 第二代; 2.3 第三代
3 專用集成電路