GPU分类
一、按接入方式划分
GPU根据接入方式可以分为独立GPU和集成GPU。独立GPU一般是封装在独立的显卡电路上,拥有独立显存,而集成GPU和CPU共用一个Die,共享系统内存。
(相关资料图)
服务器GPU可做专业图形处理、计算加速、深度学习等应用,根据云计算、人工智能等一系列技术的发展,服务器GPU将以独立GPU为主。
独立GPU
大部分封装于独立显卡电路上,使用Pcie接口和特定显存,性能相对更好,渲染画质更佳,主要用于游戏、高性能计算等中高端领域。主要的厂商包括AMD(Radeon系列)、NVIDIA(Geforce系列)。
集成GPU
集成GPU集成在主板上,通常未拥有独立显存,它于CPU共同使用Die和系统内存,能够节省空间占位和制作难度,价格比较低,兼容性更好,并且供电量少,主要用于办公室等终端领域。主要的厂商包括intel(HD系列)、AMD(APU系列)。
二、应用端划分
GPU按照应用端可以划分为PC GPU、服务器GPU、移动GPU。
PC端
集成GPU主要运用于提高轻办公效率,对性能要求低;独立GU主要运用于图形设计、提高图片制作清晰度以及3A游戏绘图渲染能力,对性能要求比较高。在轻度办公场景下会优先考虑集成GPU,提高效能;在重度办公场景下会优先考虑独立GPU,保证性能输出。
服务器端
服务器GPU主要进行可视化处理、AI训练、AI推断的深度学习等应用,根据云计算、人工智能等一系列技术的发展,服务器GPU以独立GPU为主
移动端
移动GPU由于专注轻薄,内部空间紧凑,所以一般采用集成GPU.提高游戏体验、提升游戏体验、提升游戏处理性能,应用场景包括AR、桌面、云计算、数据中心等。
三、影响GPU性能的因素
性能是衡量GPU运行、执行命令高效的指标。在评估GPU性能的指标中,微架构、制程、流处理器数量和核心频率对GPU性能影响较大。GPU的微架构、制程、显存容量/位宽/带宽/频率、核心频率等各类性能参数及重要性程度,可以通过“核心数核心频率2”公式进行量化,并可利用3DMark、MLPerf等软件进行相关性能测试评估。
微架构、制程、核心频率
微架构:又称为微处理器体系结构,是硬件电路结构,用以实现指令执行。
制程:指GPU集成电路的密集度。在晶体管硬件数量一定的情况下,更精细的制程能够减少功耗和发热。
核心频率:代表了GPU显示核心处理图形频率的大小,能够反应显示核心的性能。
图形处理单元数量、CUDA核心数、Tensor核心
图形处理器单元数量
指GPU内部图形处理单元,涵盖光栅单元(ROP)和纹理单元(TMU)等数量。
CUDA核心数
GPU内部的流处理器,是主要的计算单元,CUDA的核心数量越大越好。4090的核心数为16384,而4080的核心数才是9728。
Tensor核心
Tensor Core(张量计算核心)是由NVIDIA研发的新型处理核心,Tensor Core(张量计算核心)可实现混合精度计算,并能根据精度的降低动态调整算力,在保持准确性的同时提高吞吐量。
显存容量、显存位宽、显存频率、显存带宽
显存容量:显存容量是显卡上显存的容量数,显存容量决定着显存临时存储数据的多少显存容量的大小决定着显存临时存储数据的能力
显存位宽:是指GPU在单位时钟周期内传送数据的最大位数,市场上的常见显存位宽有128位、192位、256位、384位、512位和1024位六种,人们习惯上叫的128位、256位显卡、384位显卡、512位显卡和1024位显卡就是指其相应的显存位宽。显存位宽越高,性能越好价格也就越高。
显存频率:显存在显卡上工作时的频率。存频率一定程度上反应着该显存的速度。
显存带宽:是指显示芯片与显存之间的数据传输速率,它以字节/秒为单位。显存带宽是决定显卡性能。
看完别忘记一键三连!