流处理器单元是统一架构GPU内通用标量着色器的称谓[1]。流处理单元直接影响处理能力,因为流处理单元是显卡的核心。流处理单元个数越多则处理能力越强,一般成正比关系,但这仅限于NVIDIA自家的核心或者AMD自家的核心比较范畴。NVIDIA和AMD的流处理单元比较不可采取近似比较,实际上AMD的应该叫流处理器单元,它每5个单元配一个数据收发的,这才是一个完整的流处理器,这样算一个流处理器。而NVIDIA的1个流处理单元却只有1个单元。这是A卡与N卡的构造区别。形象点说,这个流处理单元相当于神经元,神经元越多大脑越发达,流处理单元越多显卡处理性能也就越强。 历史发展
流处理器的概念起源于微软推出的DirectX 7中的T&L(坐标转换和光源)概念[2]。随着显卡核心芯片技术的发展,在DirectX 8中,微软首次提出了Shader的概念,并将其分为Vertex Shader(顶点着色器)和Pixel Shader(像素着色器)。在DirectX 10一代显卡中,业界提出了一个新的统一渲染架构的概念,将原有的VS单元和PS单元统一起来,统称为Shader运算单元,即流处理器。 架构原理
在同一架构的显卡中,流处理器的个数通常是越多越好。然而,由于NVIDIA和AMD的GPU架构存在根本性差异,导致流处理器的工作方式和用途有所不同,因此不能直接比较流处理器的数量。A卡的GPU流处理器数量多,但一个流处理器单元相对于N卡的流处理器更加强大。A卡的流处理器通常指流处理单元,而N卡的流处理器则是Stream Processing Unit。N卡的流处理器具有完整的ALU(算术逻辑单元)功能,能够充分工作;而A卡的流处理器的5个流处理单元固定且不能拆分重组,可能会出现闲置的情况。此外,A卡的设计使其在浮点运算方面的能力较强,适合于科学计算等领域。