计算机体系结构一种量化方法笔记(1)

1.1介绍

计算机技术在大约70年的时间里取得了惊人的进步

第一台通用电子计算机诞生了。今天,不到500美元

会买一部性能和世界上最快的手机一样好的手机

计算机在1993年以5000万美元的价格购买。这一迅速的进步

从制造计算机的技术进步和

计算机设计。

尽管技术进步在历史上相当稳定,

由于更好的计算机体系结构而产生的进展不太一致。

在电子计算机诞生的前25年里,两股力量都做出了重大贡献,

每年提高约25%的绩效。迟到的

20世纪70年代出现了微处理器。微处理器的能力

随着集成电路技术的进步

业绩增长率约为每年35%。

这种增长速度,加上量产的成本优势

微处理器,导致越来越多的计算机业务

在微处理器上。此外,计算机市场上的两个重大变化

使它比以往任何时候都更容易成功的商业与一个新的架构。

首先,汇编语言编程的虚拟消除减少了

目标代码兼容性的需要。二是创建标准化,

独立于供应商的操作系统,如UNIX及其克隆版Linux,降低了

推出新架构的成本和风险。

这些变化使得成功地开发一套新的体系结构成为可能

使用更简单的指令,称为RISC(精简指令集计算机)

架构,在20世纪80年代早期。基于RISC的机器引起了人们的注意

关于两种关键性能技术的设计,教学的开发-

级别并行性(最初通过管道,后来通过多个

指令问题)和缓存的使用(最初是简单的形式,后来使用

更复杂的组织和优化)。

基于RISC的计算机提高了性能标准,迫使先前的体系结构

跟上或消失。数字设备Vax不能,所以

被RISC架构所取代。英特尔迎接挑战,主要是通过翻译

80x86指令内部转换成类似RISC的指令,允许它采用

许多创新最初是在RISC设计中首创的。晶体管计数

在20世纪90年代后期,翻译更复杂的

x86体系结构变得微不足道。在低端应用中,比如手机,

x86转换开销在电源和硅领域的成本有助于

RISC架构,ARM,成为主导。
图1.1显示了架构和组织的结合

增强导致业绩以每年的速度持续增长17年

超过50%——这在计算机行业是前所未有的。

20世纪这种戏剧性的增长率的影响是四倍。

首先,它大大增强了计算机用户的可用能力。为了

在许多应用中,高性能微处理器的性能优于

不到20年前的超级计算机。
在这里插入图片描述其次,这种成本性能的显著提高导致了新一代计算机的出现。个人电脑和工作站是在80年代随着微处理器的出现而出现的。在过去的十年里,智能手机和平板电脑的兴起,许多人将其作为自己的主要计算平台,而不是PC机。这些移动客户端设备正越来越多地使用互联网访问包含100000台服务器的仓库,这些服务器的设计就像是一台巨大的计算机。第三,摩尔定律所预言的半导体制造业的进步导致了微处理器计算机在整个计算机设计领域的主导地位。传统上由现成逻辑或门阵列制成的微型计算机被用微处理器制成的服务器所取代。甚至大型计算机和高性能超级计算机都是微处理器的集合。先前的硬件创新导致了计算机设计的复兴,强调了建筑创新和技术改进的有效利用。这一增长速度进一步加剧,到2003年,高性能微处理器的速度是单纯依靠技术(包括改进的电路设计)所能获得的速度的7.5倍,即每年52%,而每年35%。这一硬件复兴导致了第四次冲击,即对软件开发的冲击。自1978年以来,这种50000倍的性能改进(见图1.1)允许现代程序员用性能换取生产力。除了像C和C++这样的面向性能的语言,还有更多的编程语言,如Javaand SCALLA。此外,像JavaScript和Python这样的脚本语言,甚至更具生产力,随着编程框架如AngularJS和Django越来越受欢迎。为了保持生产力并试图缩小性能差距,使用实时编译器和基于跟踪的编译的解释器正在取代传统的编译器和past的链接器。软件部署也在改变,通过Internet使用的软件即服务(SaaS)取代了必须在本地计算机上安装和运行的收缩包装软件。应用程序的性质也在改变。语音、声音、图像和视频正变得越来越重要,可预测的响应时间对用户体验至关重要。谷歌翻译就是一个鼓舞人心的例子。此应用程序设置为支持CellPhoneTopoIntitSameraataNobject,图像通过Internet无线发送到仓库级计算机(WSC),该计算机可识别照片中的文本并将其翻译为您的母语。你也可以用它说话,它会把你说的话翻译成另一种语言的音频输出。它翻译90种语言的文本和15种语言的语音。图1.1也显示了这17年来的坚忍不拔。根本原因是,几十年来半导体工艺的两个特点不再适用。1974年,罗伯特·丹尼德观察到,即使由于每个晶体管的尺寸较小而增加了晶体管的数量,在给定的硅面积内,功率密度也是恒定的。
值得注意的是,晶体管可以走得更快,但功耗更低。2004年左右,由于电流和电压无法持续下降,并且仍然无法保持集成电路的可靠性,丹尼德的比例缩放结束。这一变化迫使微处理器行业使用多个高效处理器或核心,而不是单一的低效率处理器,2004年,英特尔取消了其高性能单处理器项目,并与其他公司一道宣布,提高性能的道路将是通过每个芯片多个处理器,而不是通过更快的单处理器。这个里程碑标志着一个历史性的转变,从仅仅依赖指令级并行(ILP)(本书前三个版本的主要关注点)到数据级并行(DLP)和线程级并行(TLP),后者在第四个版本中出现并在第五个版本中得到扩展。第五版还添加了WSCs和请求级并行(RLP),在本版中进行了扩展。编译器和硬件在没有程序员注意的情况下密谋利用ILP,而DLP、TLP和RLP是显式并行的,需要重新构造应用程序,以便利用显式并行。在某些情况下,这很容易;在许多情况下,这对程序员来说是一个重大的新负担。Amdahl定律(第1.9节)规定了每个芯片的有用核心数量的实际限制。如果任务的10%是串行的,那么不管你在芯片上放了多少内核,并行的最大性能收益都是10。最近结束的第二个观察是摩尔定律。1965年,戈登·摩尔(Gordon Moore)曾著名地预言,每片芯片上的晶体管数量将每年翻一番,1975年修正为每两年一次。这一预测持续了大约50年,但不再成立。例如,在这本书的2010年版中,最新的英特尔微处理器有11700000个晶体管。如果摩尔定律继续下去,我们本可以预计2016年微处理器将拥有1872000万个晶体管。相反,等效的英特尔微处理器只有17.5亿个晶体管,或者比摩尔定律预测的少10倍。组合

由于摩尔定律的减慢和晚餐规模的结束,晶体管不再有太大的改善,微处理器的不变功率预算,用多个能量效率高的处理器替换单功耗处理器,实现Amdahl定律的多处理限制

导致处理器性能的改善放缓,即每20年翻一番,而不是像1986年到2003年那样每1.5年翻一番(见图1.1)。提高能源性能成本的唯一途径是专业化。未来的微处理器将包括几个特定于领域的核心,这些核心只能够很好地执行一类计算,但它们的性能明显优于通用核心。本版新的第7章介绍了特定于域的体系结构。

本文是关于架构的思想和伴随的编译器的改进,这些改进使得在过去的一个世纪里不可思议的增长率成为可能,戏剧性的变化的原因,以及对架构、编译器的挑战和最初有希望的方法,这是一种计算机设计和分析的定量方法,它使用程序、实验的经验观察,以及模拟程序。这是本文所述的计算机设计的风格和方法。本章的目的在于展示以下章节和附录所依据的量化基础。这本书的写作不仅是为了解释这种设计风格,而且也是为了激励你参与到这一进程中来。WebelieveThisApproach将为未来的计算机服务,就像它为过去的隐式并行计算机服务一样。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章