高性能计算( 五 ) _生活百科

文章插图
性能参数高速快取存储器的体积也会对性能产生影响，它能减少主频所承载的工作负荷以提高其运算速度。处理器核心的数量(Ncores)同样会影响性能和成本。记忆体子系统的速度可以根据双列直插记忆体模组频率(fDIMM)和汇流排频率(fBus)进行参数化，它在工作负荷状态下也对性能产生影响。同样，电缆相互连线(interconnect fabric)的速度取决于信道点对点串列的频率。而其他一些因素，比如双列直插记忆体模组记忆体延迟(DIMM CAS Latency) ，存储信道的数量等都做为次要因素暂时忽略不计。使用的性能参数在图示中标明的6个性能参数中，保留四个和模型相关的参数。首先忽略信道点对点串列的频率(fPCIe) ，因为它主要影响的是电缆相互连线(interconnect fabric)速度的性能，这不在範围之列。接下来注意一下双列直插记忆体模组频率(fDIMM)和汇流排频率(fBus)会由于记忆体控制中心(MCH)而限于固定比率。使用的双核系统中，这些比率最具代表性的是4:5, 1:1, 5:4 。一般情况下只会用到其中的一个。高速快取存储器的体积非常重要。在这个模型中保留这个参数。核心的数量(Ncores)和核心频率(fcore)也非常重要，保留这两个参数。高性能计算(HPC)模型　这第二个模型的基本形式在计算机体系研究领域已经存在了很多年。A普通模式是：(3) CPI = CPI0 + MPI * PPM这里的CPI指的是处理器在工作负荷状态下每执行一个指令的周期。CPI0是指核心CPI ， MPI I则是指在工作负荷状态下高速快取存储器每个指令失误的次数(注释：在高性能计算领域， MPI主要用于信息传递界面，在此处主要是指处理器构造惯例) ， PPM是指以处理器时钟滴答声为单位对高速快取存储器每个指令失误的次数的记录。第二和第三个方程式相互吻合。这第一个术语代表的是处理器，第二个术语代表的是记忆体。可以直观的看到，假设每项工作下执行的P指令的工作负荷与代表处理器的频率的核心频率(每秒钟处理器运行周期的单位)再与方程式(3)相乘，就得到了方程式(4):Tnode = (CPIo * P) * (1 / fcore) + (MPI * P) * PPM * (1 / fcore) 在这里要注意(CPIo * P)是以每项工作分配下处理器的运行周期为单位，对微处理器架构上运行的既定工作负荷通常是个恆量。因此把它命名为α 。(处理器周期本身无法对时间进行测算，如果乘以核心的频率就可以得到时间的测算标準。因此Tnode在方程式(4)的右边) 。(MPI * P)也是同理。对于既定工作负荷和体系结构来说它也是个恆量，但它主要依赖于高速快取存储器的体积。我们把它命名为M(MBcache) 。而PPM是指访问主存的成本。对于既定的工作负荷来说，通常是个固定的数字C 。PPM乘以记忆体频率和汇流排频率的比值(fcore / fBus)就从汇流排周期(bus cycles)转化成了处理器周期。因此PM = C * fcore / fBus 。套入M(MBcache)就可以得到：(5) Tnode = α * (1 / fcore) + M(MBcache) * (1 / fbus)这个例子说明汇流排频率(bus frequency)也是个恆量，方程式(5)可以简化为方程式(6)：(6) Tnode = α * (1 / fcore) + β在这里Tcore = α * (1 / fcore) ，而Tmemory = β(也就是公式2里的术语。我们把这些关键点关联在一起) 。首先在模型2里，公式5和公式6都有坚实的理论基础，因为经分析过它是如何从公式3推理而来(它主要套用于计算机体系理论) 。其次，这个模型4个硬体性能参数的3个已经包括其中。还差一个参数就是核心数量(Ncores) 。用直观的方式来说明核心的数量，就是假设把N个核心看做是一个网路频率上运行的一个核心，称之为N*fcore 。那幺根据公式(6)我们大致可以推算出：(7) Tcore ~ α / (N*fcore)Tcore~ ( α / N) * (1 / fcore )也可以把它写成：(8) αN = ( α / N)多核处理器的第一个字母Alpha可能是单核处理器的1/N次。通过数学推算这几乎是完全可能的。通常情况下我们是根据系统核心和汇流排频率(bus frequencies)来衡量计算机系统性能，如公式(5)所阐述的。但是公式(5)的左边是时间单位--这个时间单位指的是一项工作量的完成时间。这样就能更清楚的以时间为单位说明右侧的主系统参数。同时请注意核心的时钟周期τcore(是指每次核心运行周期所需的时间)也等同于(1 / fcore) 。汇流排时钟(bus clock)周期也是同理。(9) Tnode = αN * τcore + M(MBcache) * τBus这个公式的转化也给了一个完成时间的模型，那就是2个基本的自变数τcore和τBus呈现出直线性变化。这对使用一个简单的棋盘式对照表对真实系统数据进行分析是有帮助的。套用发展大家已逐渐认同这一观点，高性能计算机是价格在10万元以上的伺服器。之所以称为高性能计算机，主要是它跟微机与低档PC伺服器相比而言具有性能、功能方面的优势。高性能计算机也有高、中、低档之分，中档系统市场发展最快。从套用与市场角度来划分，中高档系统可分为两种，一种叫超级计算机，主要是用于科学工程计算及专门的设计，如Cray T3E；另一种叫超级伺服器，可以用来支持计算、事务处理、资料库套用、网路套用与服务，如IBM的SP和国产的曙光2000 。