图形处理器GPU

启闳半导体科技（江苏）有限公司QiHong Semicon TECHNOLOGY (JIANGSU) CO.,LTD

图形处理器GPU

来源:整理综合自《集成电路产业全书》 | 作者:Belle | 发布时间: 2022-07-24 | 245 次浏览 | 分享到:

图形处理器(Graphics Processing Unit, GPU)，早期又称视觉处理器、显示芯片，是一种应用于个人计算机、工作站、游戏机和移动设备上进行图形和图像处理的微处理器。图形处理器将计算机系统所需要的显示信息进行转换，最终传输给显示器进行显示，因此图形处理器是“人机交互”的重要设备之一。

图形处理器的设计关键是数据并行，往往采用指令层面的单指令多数据(Single-Instruction Multiple Data, SIMD)或者单指令多线程(Single -Instruction Multiple- Thread, SIMT) 和架构层面的多核等技术。SIMD 将多个数据元素打包供单条指令处理，提高对矢量数据的处理速度，但无法有效处理分支。SIMT 是SIMD技术的一种改进，可让同时运行的一组独立线程共享指令，且允许每个线程具有不同分支。图形处理器往往包含数十甚至上百个流处理器(Stream Multiprocessor, SM)，每个流处理器又包含几十个线程处理器(Thread Processor,TP)。NVIDIA公司最新研发的TTAN x GPU有3584个处理核心。为了充分利用这些处理器的运算能力，图形处理器需要设计高带宽的片上存储设备。

随着大数据、云计算以及机器学习的兴起，数据处理规模越来越大，利用GPU进行通用计算已经引起广泛关注，并促生了通用图形处理器(Geneal-Purpose Computing on GPU, GPGPU)。广泛使用的GPGPU平台有OpenCL,OpenGL和CUDA等。OpenCL (Open Computing Language)是一个面向异构系统通用计算并行编程的开放、免费的标准。

OpenGL (Open Graphics Library)定义了一个跨平台、跨语言的高性能的图形程序接口。CUDA (Compute Unified Device Architecture)定义了一个通用并行计算架构。CUDA通过将需要大量计算的任务进行多级划分来实现并行编程，其首先将任务划分为任务块(Block)，然后再将任务块划分为更细粒度的CUDA线程(Thread), 最后将这些线程分配给GPU中的处理核心来执行。

GPU不但在传统图像处理领域发挥着重要作用，而且以极高的数据吞吐量推动着高性能计算和人工智能的发展。谷歌、百度、Facebook 等公司已成功利