ati9550(12代cpu一定要1700扣具吗)

导读:本文带你回顾从CPU到GPU的历史,然后展望从GPU到TPU的未来。作者:钱刚来源:华章科技01 第一代、第二代GPU1998年,英伟达宣布GPU研发成功

导读:本文带你回顾从CPU到GPU的历史,然后展望从GPU到TPU的未来。

作者:钱刚

来源:华章科技

ati9550(12代cpu一定要1700扣具吗)插图

01 第一代、第二代GPU

1998年,英伟达宣布GPU研发成功,这是计算机显示的历史性突破。此后,从70年代末到1998年,称为前GPU时代,即前GPU时代,1998年以后称为GPU时代。

在前GPU时代,一些GPU厂商开发了自己的GPU。这些GPU仍然在不断改进和广泛使用,它们的价格也非常昂贵。

现代GPU使用的晶体管数量已经远远超过CPU。2.4GHz的英特尔奔腾IV CPU使用了5500万个晶体管,英伟达在GeForce FX GPU上有超过1.25亿个晶体管,英伟达7800 GTX有3.2亿个晶体管。

1993年1月,由黄仁勋等人创办的Nvidia公司在硅谷的中心圣克拉拉成立。它是一家芯片设计公司,为电脑和游戏机生产显卡和GPU。

黄仁勋1963年出生于中国台湾省,年轻时随父母移居美国。20岁时,黄仁勋遇到了他现在的妻子萝莉。他向萝莉承诺,30岁时会拥有自己的公司。1993年,30岁的黄仁勋创立了英伟达,兑现了这个承诺,迎来了他人生的转折点。

英伟达的显卡产品线分为GeForce和Quadro两个系列。1999年,GeForce出道,产品覆盖桌面和移动领域。

英伟达最初的产品NV1和NV2是基于二次纹理贴图来实现三维效果的。微软的Direct 3D polygon 3D图形标准发布后,他们失去了市场。这次失败将英伟达带到了破产的边缘。如果没有SEGA早期700万美元的订单,英伟达仍然可以开发NV3,英伟达可能已经不复存在。

因为NV1和NV2的失败,英伟达把命运押在了NV3上,也就是大家熟悉的Riva128显卡。Nvidia吸取了教训,为Direct 3D和OpenGL提供了完整的支持。它的三维表现超越了非滑翔游戏中的巫毒。

Voodoo只是一个纯粹的3D加速卡,而Riva128拥有完整的2D加速能力。Riva128迅速成为OEM和零售商的宠儿。1998年,Riva128发布不到一年,其出货量一举超过voodoo,让Nvidia起死回生。

1998年,Nvidia发布了RivaTNT,但其硬件指数不属于voodoo2 SLI。当时游戏基本支持Glide,但是Glide的很多高级特性在DX和OpenGL上根本找不到。TNT的2D图像质量很差,许多2D用户对此不感兴趣。相比之下,英特尔的第一款显卡i740拥有当时最好的2D显示能力,赢得了大量市场。

1998年晚些时候,Nvidia发布了TNT2。这款GPU彻底纠正了TNT的缺点。TNT2给了3Dfx致命一击。最后,3Dfx的知识产权在2000年被英伟达买断。

Nvidia的TNT2,ATI的Rage,3Dfx的Voodoo都属于第一代现代GPU。这一代GPU独立于CPU更新像素缓冲区,可以栅格化三角面片,执行纹理操作。但是这一代GPU不能进行3D顶点的空之间的坐标变换,要靠CPU计算顶点坐标变换。第一代GPU功能有限,只能用于纹理组合的数学计算或者像素颜色值计算。

1999年,Nvidia发布了Geforce256(见图25-1)。其核心是NV10,采用0.22微米制程工艺,拥有四条渲染流水线。每个流水线有四个像素单元和一个材质单元,并提供SDRAM和DDR SDRAM两种不同的内存配置。GeForce 256支持Direct3D 7.0、T &和l OpenGL1.2的高级图形技术,这使其成为生命周期最长的产品。

ati9550(12代cpu一定要1700扣具吗)插图(1)

▲图25-1 英伟达的GPU:Geforce256▲图25-1英伟达的GPU:GeForce 256

Geforce256发布的时候,NVIDIA造出了GPU(图形处理单元)这个词。在Geforce256之前,t & L由CPU或另一个独立处理器处理。

将t & L集成到GPU中是一大进步,因为GPU接管了CPU的大量工作。t & L engine的效果是可以用更多的多边形来刻画3D模型,使得3D效果更加细腻。对于光照,CPU不用计算大量的光照数据,直接通过GPU就能获得更好的性能。

T & ampl是GPU的一个规范名称,即Transforming and Lighting的首字母缩写,意为光影转换。在GPU中,T &最大的作用是处理图形整体角度旋转、光源阴影等三维效果。

在Geforce256面前,3Dfx根本没有反击的可能。这是一个杰出的芯片,也是世界上第一个真正的GPU。它拥有硬件t & L的完整支持,以及两倍于TNT2的性能指标。使用DDR内存后,性能是voodoo3的两倍。Geforce256让NVIDIA称霸显卡和GPU市场。

02 第三代、第四代GPU

2000年,ATI发布了继Geforce256之后的第二款真正意义上的GPU——Radeon256。其性能优于前者。甚至和后来的Geforce2 GTS比起来,一点都不差。

2000年,Nvidia发布了CPU——Geforce2 MX,一款低端经典CPU,让Nvidia牢牢守住了低端市场,而3Dfx的处境却越来越凄惨。

2000年是显卡厂商重新洗牌的开始。S3、SIS等厂商无力与Nvidia、ATI竞争,淡出显卡市场。英伟达的产品细分策略也让ATI很弱。ATI没有成功挑战Nvidia的霸主地位,但它选择了GPU的道路,避免了和其他厂商一样的命运。

4核voodoo56000也没有挽救3Dfx的命运。72瓦的高功耗使其成为第一款需要外部电源的显卡,而AGP接口无法提供这么高的功率。然而,voodoo5 6000因为稀有而成为一种流行的显卡。

2000年12月,3Dfx被英伟达收购。终结一代神话,留给人们无尽的叹息。

2001年DX版本升级到8.0,GeForce3成为第一个支持DX8.0的GPU,Xbox的订单让Nvidia如虎添翼,但ATI也毫不示弱。2001年年中,DX升级到8.1,镭龙8500成为第一个全面支持DX8.1的GPU,性能相比Geforce3有了显著提升。

这使得ATI成为继3Dfx之后唯一有实力与Nvidia抗衡的厂商。但是Radeon8500的驱动很让人头疼,它依然是一款优秀的产品。800的前身Radeon7500以GeFroce2 MX的价格和超过GeForce2 Pro的性能成为低端GPU明星。

很快,GeFroce2Ti和pro凭借更先进的制造工艺,凭借更好的性价比,让英伟达重新夺回了低端市场。这一年也是ATI成立16年来首次出现亏损。

2001年,第三代GPU时期开始,第三代GPU已经具备顶点可编程能力,比如GeForce 4Ti,(见图25-2)ATI 8500等。这些GPU允许应用程序为顶点操作指定一系列指令,这是GPU编程的本质。

这是一个具有开拓意义的时期。这一时期确立的GPU编程思想一直延续至今。它不仅深入到工程领域改善人们的日常生活,还创造了计算机科学的许多新领域,如体绘制、光照模拟、人体动画、通用计算等。同时,Direct8和OpenGL也提供了对顶点编程能力的支持。

但是这一代GPU还没有支持像素级的编程能力,也就是片段可编程性。

ati9550(12代cpu一定要1700扣具吗)插图(2)

▲图25-2 英伟达的GPU:GeForce 4Ti▲图25-2英伟达的GPU:GeForce 4Ti

顶点就是我们熟悉的三维图形的顶点。因为三维模型是基于坐标空的内部设计的,所以顶点信息包含了三维模型在空中的坐标。

顶点着色器(Vertex Shader)是顶点信息的算术程序员,它可以通过给出特定的算法来改变工作中三维模型的形状。顶点投影器的顶点运算单元可以直接检索内存中的材质数据。现代三维游戏的场景极其复杂。涉及的材质和多边形数量惊人。游戏开发者必须利用顶点投影这一新特性,充分发挥想象力,实现漂亮的特效。

2002年,微软降价出售XBOX以对抗PS2。这让英伟达非常不满,微软选择ATI作为其下一代主机的GPU供应商。英伟达也不示弱。同年发布了GeForce4系列产品,其低端产品GeForce4 MX440长期以来一直是低端显卡的性能标杆。

英伟达没想到的是,今年ATI牺牲了自己最好的产品:R300(见图25-3)。它的性能几乎是英伟达产品的两倍。ATI让NVIDIA措手不及。从此,ATI和Nvidia平起平坐。

ati9550(12代cpu一定要1700扣具吗)插图(3)

▲图25-3 ATI R300的构架▲图25-3 atir 300的架构

R300的出现让Nvidia措手不及。很快,Nvidia开发了下一代产品:GeForce FX。

但是Nvidia太心急了,不成熟的0.13微米工艺和过高的频率毁了FX5800Ultra。它的性能勉强超过9700pro,但是,它的热量和噪音成为一个严重的伤害。它在GPU历史上首次采用涡轮散热。在性能仅略高于9700pro的情况下,功耗却是9700pro的两倍。这个GPU是Nvidia最失败的产品。

2003年,ATI推出了支持DX9和DDR2的9800pro。9800XT再次击败FX5900。Nvidia后来发布的FX5950在功耗远远超过9800XT的情况下,仍然落后于9800XT。今年ATI在GPU领域领先于Nvidia。

2002年底到2003年,出现了第四代GPU,GPGPU。在SIGGRAPH 2003大会上,与会者讨论了利用GPU进行通用计算的思想和模型,奠定了GPGPU的基础。随后的三年,用统一的流处理器替换GPU中不同着色单元的设计,释放了GPU的计算能力,为今天的GPU编程计算奠定了基础。

英伟达的GeForceFX和ATI镭龙9700是第四代GPU的先驱。两种GPU都具有顶点编程和片段编程能力。同时,DirectX和OpenGL已经扩展了它们的API来支持顶点编程和片段编程。2003年后,可编程GPU正式诞生。随着DirectX和OpenGL的不断完善,宣布了基于图形硬件的编程技术,即GPU编程。

可编程GPU也有缺点。在GPU中,任何元素的计算都与同类型的其他数据无关,这使得依赖于数据之间相关性的算法很难实现,比如光线和物体的相交。GPU中的控制器远少于CPU,所以它的控制能力有限。

另外,GPU编程必须要知道计算机图形学和图形处理API的知识,这需要很高的门槛和很长的学习周期。早期的GPU编程使用汇编语言,开发难度大,效率低。但是随着高级着色器语言的兴起,GPU编程变得容易多了。

可编程GPU应用广泛。特别是在科学可视化计算方面,GPU有很大的优势。由于人体CT、地质勘探、气象数据、流体力学等科学可视化计算处理的数据量巨大。,基于CPU的计算无法满足实时性要求,GPU上的计算效率很高。

CPU上很多耗时的算法都可以移植到GPU上。目前,基于GPU的科学可视化研究已经成为主流。

可编程GPU的通用算法有着非常好的前景。目前,基于GPU的通用计算的研究非常热门,称为GPGPU(图形处理单元上的通用计算,也称为GPGP或GP2)。许多通用算法如数值计算已经在GPU上实现,并且性能良好。

目前线性代数、物理模拟、光线追踪算法已经成功移植到GPU上。这一切都是因为2003年之后,GPU正式进入可编程阶段。GPU的并行处理能力比CPU强,所以用户可以让GPU同时并行处理很多顶点数据。GPU虽然有很强的并行能力,但并不能取代CPU,因为它无法实现CPU强大的逻辑运算能力。

2004年,Nvidia的GeFroce 6800Ultra使其重新夺回了GPU老大的位置(见图25-4)。ATI X800在性能上不属于GeFroce 6800ultra,但是不支持最新的DX。GeFroce 6800Ultra全面支持9.0c,而X800只支持9.0b,这一次ATI又被打败了。

ati9550(12代cpu一定要1700扣具吗)插图(4)

▲图25-4 英伟达的GeFroce 6800Ultra▲图25-4英伟达的GeFroce 6800Ultra

GeForce 6800Ultra作为一款面向高端市场的显卡,渲染流水线增加到了16条。GDDR3显存频率达到1.1GHz,内存带宽达到35.2 GB/s,相比上一代GPU,性能有了很大提升。

2004年,ATI在低端市场创造了一个神话:Radeon9550。这款GPU是ATI历史上最成功的产品,售价500美元。其镭龙9550在性能上并不逊色于镭龙9600。通过修改BIOS,可以直接拥有镭龙9600的性能,通过修改驱动,可以成为专业的GPU。

这个时候英伟达在低端市场只有FX5200,正是英伟达在低端市场的不作为成就了Radeon9550(见图25-5)。

ati9550(12代cpu一定要1700扣具吗)插图(5)

▲图25-5 ATI的Radeon9550▲图25-5 ATI的Radeon9550

2005年,Nvidia发布了第二代9.0c显卡Geforce 7800GTX,性能比6800Ultra提升了40%。因为ATI工艺,第四季度推出了以R520为核心的镭龙X1800,性能上略胜7800GTX。今年GPU市场略显平淡。

2006年,Nvidia在将显存翻倍的同时,还将7800GTX的核心频率提高了25%,带来了超过20%的性能提升。×1800的优势瞬间消失。第一代经典R580奋起直追,而× 1900击败了7800GTX 512MB,即使面对后来的7900GTX,× 1900也毫不逊色。

7950GX2作为Nvidia的第一款双PCB双核卡出现。然后ATI用GDDR4显存,推出DX9时代最强单核GPU radeonx 1950 XTX,成就了ATI最后的辉煌。2006年7月,AMD收购了ATI。

2006年底,真正的内存革命来了。DX10统一了渲染架构和顶点着色引擎,结束了像素渲染和引擎的分离。Nvidia的8800GTX也是因为Windows Vista没有发布,在没有任何DX10游戏支持的情况下,取得了超过1950XTX近50%的性能领先。8800GTX赢得了当时媒体的各种好评。

03 GPU的新发展

2007年,AMD在8800GTX上市半年后推出了以R600为核心的2900XT。512位环形内存总线使其成为高功耗、高发热的GPU,但性能没有超过8800GTS。R600的失败让G80成为史上最长寿的内核,它的后代G92延续了三代显卡。

2007年AMD推出的以RV670为核心的HD3870/3850,相对于2900XT的失败,是一款性价比非常优秀的核心,抛弃了环形总线,位宽降低到了256位。其极低的成本使其拥有极高的议价资本。AMD甚至还做了双核卡——HD 3870 x2。由于RV670的成功,AMD放弃了大核战略。

因为AMD的弱势,Nvidia放慢了升级速度。2008年7月,Nvidia发布了以G92为核心的9800GTX,相比G80没有实质性的提升,这给了AMD一个机会。同年,以800SP为核心的RV770成为AMD的王牌。HD4850一夜之间迫使9800GTX降价一千元。

今年AMD的HD4870打败了NVIDIA的新GPU:GTX260,它的高端GTX280也被AMD的4870X2打败。Nvidia不得不临时升级GTX260,推出GTX260+,这才挽救了市场。9800GTX升级为9800GTX+后,继续作为GTS250。G92核心寿命极高。

虽然主流市场被AMD打败,但是GTX280和GTX295保住了NVIDIA GPU性能王的地位。

GeForce GTX 280采用65纳米工艺,拥有240个流处理器,支持双精度浮点运算。其内存带宽高达142GB/s,强大的规格稳固了Nvidia在高端市场的地位。

2009年9月,AMD发布了支持Direct×11的镭龙HD 5800系列GPU。镭龙HD 5800系列凭借全新的Direct×11支持和出色的规格,冲击了GeForce GTX 200系列的地位。

2010年,Nvidia发布了全新的GPU架构,但却犯了和FX5800一样的错误。以费米架构为核心的GTX480以巨大的功耗和发热著称。据说有人用480煮过鸡蛋,可见480有多火。

相比之下,HD5870要好得多。其双核版本HD5970一年多来一直是GPU性能之王。在升级了最新的工艺后,费米改善了高发热的问题,还将流处理器的数量增加到了512个。同年,英伟达获得了一个新绰号:核弹。因为有媒体在评测GTX580的时候GPU爆了。

2011年,英伟达重组了费米核心,推出了GeForce GTX 580。上一代GTX 480因为成品率低,没有采用完整的费米核,所以砍掉了原设计中的512个流处理器。

在以GF110为核心的GeForce GTX 580中,有512个流处理器,GF110进一步优化了纹理采样和算法。与GF100核心相比,GeForce GTX 580在更高的工作频率下实现了功耗和温度的平衡,并在性能上超过了AMD的镭龙6970。

2011年,Nvidia正式推出GeForce GTX560 Ti,弥补了中高端GPU中空的不足。它采用了全新的GF114架构,GF114并没有在旗舰核心上进行切割,而是对CUDA核心和SM单元进行了优化,使其更加符合市场定位,这使得它在中高端GPU市场获得了不错的反响。

2012年,在镭龙HD 6970低迷之后,AMD重振旗鼓,发布了全新的基于CGN架构的镭龙HD 7970 GPU。它采用了TSMC最新的28nm工艺,不再使用投影分频模式。在增加CUDA数量的同时,使得同频工作模式的功耗相对低于投影模式。

在AMD推出镭龙HD 7970三个月后,Nvidia推出了基于新开普勒架构的GeForce GTX 680 GPU。它在游戏性能、功耗和价格方面都比镭龙HD 7970更强大。

自GeForce GTX 680以来,GPU中引入了GPUBoost动态加速。GPU Boost根据TDP(热设计功率)范围值提高核心频率或降低到标准频率,也适用于超频。

在开普勒架构上,Nvidia推出了新的TXAA抗锯齿。与多采样抗锯齿(MSAA)相比,画面更好,性能更高。同时,为了解决帧数过低时开启垂直同步导致的帧数骤降,Nvidia在新的TXAA抗锯齿中加入了自适应垂直同步(Apdative VSync)技术。

2013年,NVIDIA推出了基于第二代开普勒架构的GeForce GTXTitan和780Ti。

第一代开普勒架构的GeForce GTX 680,作为旗舰级GPU,各方面表现出色。在此基础上,Nvidia推出了大核GK110,并命名为GeForceGTX Titan。它第一次没有采用数字编号的命名方式。泰坦意味着性能最高的GeForce显卡。

最早使用GK110架构的GPU是英伟达的Tesla/K20/K20X。他们的单/双精度浮点性能在当时达到了历史最好。

GeForce GTX泰坦的整体规格和NVIDIA的Tesla K20X差不多,2688CUDA核心,优化的SMX单元,更高的工作频率,是当时单卡中性能最强的。在当时的GPU市场上,GeForce GTX泰坦的性能无可比拟,但其7999元的价格却让很多消费者望而却步。

Nvidia很快推出了GK110的完整核心架构,核心中有所有15组SMX单元。同时,核心和显存的频率也有所提高。GK110核心提升了功耗和温度,基于此的GeForce GTX 780Ti GPU让Nvidia再次成为GPU之王。

2014年至2015年,英伟达推出了高效的Maxwell架构和基于该架构的GPU:GeForce GTX 980和GeForce GTX 970。

从费米到开普勒架构,NVIDIA在追求极致性能的同时,努力降低GPU功耗。第一代Maxwell架构是GM107的核心,定位略低,改进了SMX单位,提高了性能功耗比。

第二代Maxwell架构的核心是GM204,在合理控制核心面积的同时,增加了SMX的数量,提高了效率。使用Maxwell架构,即使使用28nm工艺,也能大幅提升性能,降低功耗。

Nvidia推出GeForce GTX 980和GeForce GXT 970不仅是为了创新其核心架构,也是为了继续压制AMD在市场上的R9镭龙290X/290GPU。

随着Nvidia领先9个月,AMD推出了R9 Radeon390/390X GPU,在夏威夷架构的基础上降低了功耗,增加了频率和内存容量。与此同时,经过CGN通用架构的不断优化,AMD终于保住了一局。

从GeForce 600系列到GeForce 900系列的GPU中,Nvidia一直采用TSMC的28纳米制程技术。2016年5月,Nvidia推出采用新一代16nm FinFET工艺技术的Pascal架构,拥有72亿个晶体管,核心频率大幅提升,让用户轻松超频突破2GHz。

Pascal架构采用GP104核,虽然不是GP100的核心,但还是带来了GDDR5X内存的升级,异步操作的提升,以及新的VR技术。

目前英伟达采用Pascal架构的GPU有GeForce GTX 1080(见图25-6)、GeForce GTX 1070和GeForce GTX 1060。三款GPU分别代表旗舰、高端和中高端水平。

ati9550(12代cpu一定要1700扣具吗)插图(6)

▲图25-6 英伟达的GeForce GTX 1080▲图25-6英伟达的GeForce GTX 1080

AMD目前只有唯一一款新机型——北极星架构的镭龙RX480,定位与GeForce GTX 1060一致,但从各方面来看,镭龙RX 480都不如GeForce GTX 1060。

在GeForce系列之前,Nvidia只是在GPU厂商百花齐放的时代里挣扎,生存,逐渐成长。如今风靡全球的GeForce系列GPU已经将其推上了GPU之王的位置。

英伟达的GeForce产品线从诞生到现在已经走过了17个年头。它为我们提供了许多经典产品。3D游戏因其卓越的性能,带给用户超震撼的体验。

04 未来的GPU发展方向

今天我们面对的芯片加工工艺已经达到了7纳米。半导体芯片的制造工艺即将达到物理极限,但我们需要处理的信息和应用不减反增。大数据和人工智能时代已经到来。

为了应对这些新情况,人们开始从传统的以CPU为主、GPU为辅的Intel处理器架构,转变为以GPU为主、CPU为辅的新架构,尽管目前的计算系统仍然是“CPU+协处理器”的混合架构。

随着机器学习算法等人工智能在各种应用领域显示出优越的性能,对机器学习算法的硬件支持已经成为处理器设计中的重要考虑因素。

目前很多机器学习算法都是在GPU上运行的,但是GPU仍然是通用芯片,在机器学习算法中性能和功耗都没有得到优化。这时候,谷歌出招了。它想制造一个专用于机器学习算法的芯片,所以它有TPU(张量处理单元)。

简单来说,CPU是完全通用的处理架构;GPU是一种通用的图像处理架构,是一种准通用的处理架构。而TPU则有明确的目标和处理逻辑,完全牺牲了通用性,为特定应用实现了极高的效率。

谷歌在其数据中心使用TPU已经有几年了(见图25-7),其性能指标非常好。它将硬件性能提前了7年,是摩尔定律的3倍。TPU的高性能来源于三个方面:控制热值、容忍低精度计算和数据本地化。

ati9550(12代cpu一定要1700扣具吗)插图(7)

▲图25-7 在谷歌数据中心应用的TPU▲图25-7 TPU在谷歌数据中心的应用

ati9550(12代cpu一定要1700扣具吗)插图(8)

▲图25-8 TPU的构架▲图25-8 TPU的结构

从CPU到GPU再到TPU,处理器经历了从通用架构到准通用架构再到专用架构的道路。未来的处理器将专门为各种应用而设计。没人知道GPU会在AI和比特币有这么大的应用,也没人知道GPU的未来会这么好。

TPU怎么样?目前只看到它的早期应用有这么光明的前景。我们无法预测TPU未来的应用,更不用说未来的处理器会是什么样子了。

作者简介:钱刚,现就职于美国德州仪器公司,从事半导体技术和半导体器件的研发工作。网络人气作者,作品在线浏览量超过1000万。钱刚的作品主要是与历史、科技相关的散文和随笔。著作主要有《美国历史与人物纪事》《美国往事》《硅谷历史》《硅谷简史》。

本文摘自《芯片改变世界》,经出版社授权。

ati9550(12代cpu一定要1700扣具吗)插图(9)

延伸阅读《芯片改变世界》读《芯片改变世界》

推荐:这本书是一本关于芯片技术发展的科普书。它着重于电子工业的出现,电子器件、半导体器件和芯片的早期产生和发展的历史。结合芯片技术及其发展历史,描述芯片产业的兴起和发展过程以及第三次和第四次工业革命。这本书的主角是芯片技术、发明家、企业家、风险投资家和企业家的历史。

免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。

作者:美站资讯,如若转载,请注明出处:https://www.meizw.com/n/117603.html

发表回复

登录后才能评论