分享

CPU2

 太阳普照万物 2011-11-26

英特尔I3I5I7处理器的参数各是什么?相互的比较与差异各是什么?还有价钱的差异?越详细越好,谢谢
    

 最佳答案

 EDCD05619_313 - 二副 十一级

酷睿i3 基本参数  生产厂商 intel  处理器架构 Intel系列   CPU类型 台式机   CPU型号 酷睿 i3 530   CPU系列 Intel Core i3   制造工艺 32纳米  CPU核心数量 双核心  cpu内核 Westmere  cpu接口 LGA 1156 [编辑本段]技术参数  主频 2.93ghz   二级缓存(KB) 2*256KB   三级缓存(KB) 4MB  超线程 4线程数 酷睿i5    Lynnfield的降临   面对着价格昂贵的Core i7,新架构处理器很难走进广大消费者的生活之中,不过近日曝光了又一款基于Nehalem架构的双核处理器,其依旧采用整合内存控制器,三级缓存模式,L3达到8MB,支持Turbo Boost等技术的新处理器——Core i5酷睿I5Core i5 采用的是成熟的DMIDirect Media Interface),相当于内部集成所有北桥的功能,采用DMI用于准南桥通信,并且只支持三通道的DDR3内存。结构上它用的是LGA1160(后改为LGA1156)接口,Core i7用的是LGA1366。  英特尔将Lynnfield定位于200美元以下的主流市场,计划是在明年3季度才推出,不久前台湾网友曾放出过Lynnfield的实物照,现在国内一位网友放出了Lynnfield的部分测试成绩。  测试中使用的Lynnfield频率为2.13GHz,其它配件为笔记本DDR3-10664G+2G)内存,笔记本ST 7200.2 160G硬盘以及PCI-E X1NVS290显卡,操作系统为Windows Vista Ultimate 64bit,这是一个桌面PC,不过配件大多是笔记本用的。  由于缺乏对比数据,所以很难对Lynnfield的性能作一个定量的判断,简单的比较而言,离3.2GHzCore i7-965的差距很大。  在CPU-Z中,直接将Lynnfield识别为Intel Core i5,这是一个有趣的信息,英特尔一直称Core i7这个名字无任何实际意义,只是好听罢了,现在看来不能尽信,那谁又将是Core i6呢,Havendale似乎是最接近的答案。  但Lynnfield不全等于酷睿I5  09年六月,英特尔公关部主任BILL CALDER详细描述了英特尔消费级桌面处理器的品牌体系,并且公布了CORE I5 CORE I3两个子品牌。  Lynnfield的确会与CORE I5有一定关联,但是不会一刀切,支持HTLynnfield和移动版Lynnfield将归于酷睿I7系列。尔不支持HTLynnfield,会被归于酷睿I5系列。  据悉,首批上市的Lynnfield,会有2.93G 2.8G 2.66G三个版本,其中前两种会支持HT,可能归于酷睿I7系列。  I5应该是最终取代老迈的酷睿2四核的产品。酷睿i7 产品图片Intel官方正式确认,基于全新Nehalem架构的新一代桌面处理器将沿用“Core”(酷睿)名称,命名为“Intel Core i7”系列,至尊版的名称是“Intel Core i7 Extreme”系列。而同架构服务器处理器将继续延用“Xeon”名称。至于为什么是“I7”,而不是大多数人认为的“Core 3”Intel方面还没给出详细的解释,估计意思是Intel的第七代处理器,但2000年推出NetBrust架构的Pentium 4处理器应该是属于第七代产品的,真正解释还是等Intel的回答吧。   Intel Core i7是一款45nm原生四核处理器,处理器拥有8MB三级缓存,支持三通道 DDR3内存。处理器采用LGA 1366针脚设计,支持第二代超线程技术,也就是处理器能以八线程运行。根据网上流传的测试,同频Core i7Core 2 Quad性能要高出很多。  英特尔首先会发布三款Intel Core i7处理器,频率分别为3.2GHz2.93GHz2.66GHz,主频为3.2GHz的属于Intel Core i7 Extreme,处理器售价为999美元,当然这款顶级处理器面向的是发烧级用户。而频率较低的2.66GHz的定价为284美元,约合1940元人民币,面向的是普通消费者。Intel

对于CPU基本知识的讲解

2008-7-30 21:12

提问者:dmcpoorness |悬赏分:5|浏览次数:1423

包括GHz,一二级缓存,频率,缓存容量,MHzCPU基本

菜鸟了解!!!!!

最好是整理好复制下来的,不要给个网站!!!!

2008-7-30 21:19

最佳答案

CPU 参数详解 

CPUCentral Processing Unit(中央处理器)的缩写,CPU一般由逻辑运算单元、控制单元和存储单元组成。在逻辑运算和控制单元中包括一些寄存器,这些寄存器用于CPU在处理数据过程中数据的暂时保存。大家需要重点了解的CPU主要指标/参数有: 

1.主频 

主频,也就是CPU的时钟频率,简单地说也就是CPU的工作频率,例如我们常说的P4(奔四)1.8GHz,这个1.8GHz(1800MHz)就是CPU的主频。一般说来,一个时钟周期完成的指令数是固定的,所以主频越高,CPU的速度也就越快。主频=外频X倍频。 

此外,需要说明的是AMDAthlon XP系列处理器其主频为PR(Performance Rating)值标称,例如Athlon XP 1700+1800+。举例来说,实际运行频率为1.53GHzAthlon XP标称为1800+,而且在系统开机的自检画面、Windows系统的系统属性以及WCPUID等检测软件中也都是这样显示的。 

2.外频 

外频即CPU的外部时钟频率,主板及CPU标准外频主要有66MHz100MHz133MHz几种。此外主板可调的外频越多、越高越好,特别是对于超频者比较有用。 

3.倍频 

倍频则是指CPU外频与主频相差的倍数。例如Athlon XP 2000+CPU,其外频为133MHz,所以其倍频为12.5倍。 

4.接口 

接口指CPU和主板连接的接口。主要有两类,一类是卡式接口,称为SLOT,卡式接口的CPU像我们经常用的各种扩展卡,例如显卡、声卡等一样是竖立插到主板上的,当然主板上必须有对应SLOT插槽,这种接口的CPU目前已被淘汰。另一类是主流的针脚式接口,称为SocketSocket接口的CPU有数百个针脚,因为针脚数目不同而称为Socket370Socket478Socket462Socket423等。 

5.缓存 

缓存就是指可以进行高速数据交换的存储器,它先于内存与CPU交换数据,因此速度极快,所以又被称为高速缓存。与处理器相关的缓存一般分为两种——L1缓存,也称内部缓存;和L2缓存,也称外部缓存。例如Pentium4Willamette内核产品采用了423的针脚架构,具备400MHz的前端总线,拥有256KB全速二级缓存,8KB一级追踪缓存,SSE2指令集。 

内部缓存(L1 Cache) 

也就是我们经常说的一级高速缓存。在CPU里面内置了高速缓存可以提高CPU的运行效率,内置的L1高速缓存的容量和结构对CPU的性能影响较大,L1缓存越大,CPU工作时与存取速度较慢的L2缓存和内存间交换数据的次数越少,相对电脑的运算速度可以提高。不过高速缓冲存储器均由静态RAM组成,结构较复杂,在CPU管芯面积不能太大的情况下,L1级高速缓存的容量不可能做得太大,L1缓存的容量单位一般为KB。 

外部缓存(L2 Cache) 

CPU外部的高速缓存,外部缓存成本昂贵,所以Pentium 4 Willamette核心为外部缓存256K,但同样核心的赛扬4代只有128K。 

6.多媒体指令集 

为了提高计算机在多媒体、3D图形方面的应用能力,许多处理器指令集应运而生,其中最著名的三种便是IntelMMXSSE/SSE2AMD3D NOW!指令集。理论上这些指令对目前流行的图像处理、浮点运算、3D运算、视频处理、音频处理等诸多多媒体应用起到全面强化的作用。 

7.制造工艺 

早期的处理器都是使用0.5微米工艺制造出来的,随着CPU频率的增加,原有的工艺已无法满足产品的要求,这样便出现了0.35微米以及0.25微米工艺。制作工艺越精细意味着单位体积内集成的电子元件越多,而现在,采用0.18微米和0.13微米制造的处理器产品是市场上的主流,例如Northwood核心P4采用了0.13微米生产工艺。而在2003年,IntelAMDCPU的制造工艺会达到0.09毫米。 

8.电压(Vcore) 

CPU的工作电压指的也就是CPU正常工作所需的电压,与制作工艺及集成的晶体管数相关。正常工作的电压越低,功耗越低,发热减少。CPU的发展方向,也是在保证性能的基础上,不断降低正常工作所需要的电压。例如老核心Athlon XP的工作电压为1.75v,而新核心的Athlon XP其电压为1.65v 

9.封装形式 

所谓CPU封装是CPU生产过程中的最后一道工序,封装是采用特定的材料将CPU芯片或CPU模块固化在其中以防损坏的保护措施,一般必须在封装后CPU才能交付用户使用。CPU的封装方式取决于CPU安装形式和器件集成设计,从大的分类来看通常采用Socket插座进行安装的CPU使用PGA(栅格阵列)方式封装,而采用Slot x槽安装的CPU则全部采用SEC(单边接插盒)的形式封装。现在还有PLGA(Plastic Land Grid Array)OLGA(Organic Land Grid Array)等封装技术。由于市场竞争日益激烈,目前CPU封装技术的发展方向以节约成本为主。 

10.整数单元和浮点单元 

ALU运算逻辑单元,这就是我们所说的整数单元。数学运算如加减乘除以及逻辑运算如ORANDASLROL等指令都在逻辑运算单元中执行。在多数的软件程序中,这些运算占了程序代码的绝大多数。 

而浮点运算单元FPU(Floating Point Unit)主要负责浮点运算和高精度整数运算。有些FPU还具有向量运算的功能,另外一些则有专门的向量处理单元。 

整数处理能力是CPU运算速度最重要的体现,但浮点运算能力是关系到CPU的多媒体、3D图形处理的一个重要指标,所以对于现代CPU而言浮点单元运算能力的强弱更能显示CPU的性能。 

CPU内核: 

核心(Die)又称为内核,是CPU最重要的组成部分。CPU中心那块隆起的芯片就是核心,是由单晶硅以一定的生产工艺制造出来的,CPU所有的计算、接受/存储命令、处理数据都由核心执行。各种CPU核心都具有固定的逻辑结构,一级缓存、二级缓存、执行单元、指令级单元和总线接口等逻辑单元都会有科学的布局。 

为了便于CPU设计、生产、销售的管理,CPU制造商会对各种CPU核心给出相应的代号,这也就是所谓的CPU核心类型。 

不同的CPU(不同系列或同一系列)都会有不同的核心类型(例如Pentium 4NorthwoodWillamette以及K6-2CXTK6-2+ST-50等等),甚至同一种核心都会有不同版本的类型(例如Northwood核心就分为B0C1等版本),核心版本的变更是为了修正上一版存在的一些错误,并提升一定的性能,而这些变化普通消费者是很少去注意的。每一种核心类型都有其相应的制造工艺(例如0.25um0.18um0.13um以及0.09um等)、核心面积(这是决定CPU成本的关键因素,成本与核心面积基本上成正比)、核心电压、电流大小、晶体管数量、各级缓存的大小、主频范围、流水线架构和支持的指令集(这两点是决定CPU实际性能和工作效率的关键因素)、功耗和发热量的大小、封装方式(例如S.E.PPGAFC-PGAFC-PGA2等等)、接口类型(例如Socket 370Socket ASocket 478Socket TSlot 1Socket 940等等)、前端总线频率(FSB)等等。因此,核心类型在某种程度上决定了CPU的工作性能。 

一般说来,新的核心类型往往比老的核心类型具有更好的性能(例如同频的Northwood核心Pentium 4 1.8A GHz就要比Willamette核心的Pentium 4 1.8GHz性能要高),但这也不是绝对的,这种情况一般发生在新核心类型刚推出时,由于技术不完善或新的架构和制造工艺不成熟等原因,可能会导致新的核心类型的性能反而还不如老的核心类型的性能。例如,早期Willamette核心Socket 423接口的Pentium 4的实际性能不如Socket 370接口的Tualatin核心的Pentium III和赛扬,现在的低频Prescott核心Pentium 4的实际性能不如同频的Northwood核心Pentium 4等等,但随着技术的进步以及CPU制造商对新核心的不断改进和完善,新核心的中后期产品的性能必然会超越老核心产品。

CPU讲解,教你如何辨别CPU 2008-09-12 10:07| (分类:默认分类)

这18条背下来没人敢和你忽悠CPU

1.主频


  主频也叫时钟频率,单位是MHz,用来表示CPU的运算速度。

CPU的主频=外频×倍频系数。很多人认为主频就决定着CPU的运行

速度,这不仅是个片面的,而且对于服务器来讲,这个认识也出现

了偏差。至今,没有一条确定的公式能够实现主频和实际的运算速

度两者之间的数值关系,即使是两大处理器厂家IntelAMD,在这

点上也存在着很大的争议,我们从Intel的产品的发展趋势,可以

看出Intel很注重加强自身主频的发展。像其他的处理器厂家,有

人曾经拿过一快1G的全美达来做比较,它的运行效率相当于2G

Intel处理器。

 

  所以,CPU的主频与CPU实际的运算能力是没有直接关系的,主

频表示在CPU内数字脉冲信号震荡的速度。在Intel的处理器产品中

,我们也可以看到这样的例子:1 GHz Itanium芯片能够表现得差

不多跟2.66 GHz Xeon/Opteron一样快,或是1.5 GHz Itanium 2

约跟4 GHz Xeon/Opteron一样快。CPU的运算速度还要看CPU的流水

线的各方面的性能指标。

 


  当然,主频和实际的运算速度是有关的,只能说主频仅仅是

CPU性能表现的一个方面,而不代表CPU的整体性能。

 


  2.外频

 


  外频是CPU的基准频率,单位也是MHzCPU的外频决定着整块

主板的运行速度。说白了,在台式机中,我们所说的超频,都是超

CPU的外频(当然一般情况下,CPU的倍频都是被锁住的)相信这点

是很好理解的。但对于服务器CPU来讲,超频是绝对不允许的。前

面说到CPU决定着主板的运行速度,两者是同步运行的,如果把服

务器CPU超频了,改变了外频,会产生异步运行,(台式机很多主

板都支持异步运行)这样会造成整个服务器系统的不稳定。

 


  目前的绝大部分电脑系统中外频也是内存与主板之间的同步运

行的速度,在这种方式下,可以理解为CPU的外频直接与内存相连

通,实现两者间的同步运行状态。外频与前端总线(FSB)频率很容

易被混为一谈,下面的前端总线介绍我们谈谈两者的区别。

 

 


  3.前端总线(FSB)频率

 


  前端总线(FSB)频率(即总线频率)是直接影响CPU与内存直接数

据交换速度。有一条公式可以计算,即数据带宽=(总线频率×

据带宽)/8,数据传输最大带宽取决于所有同时传输的数据的宽度

和传输频率。比方,现在的支持64位的至强Nocona,前端总线是

800MHz,按照公式,它的数据传输最大带宽是6.4GB/秒。

 


  外频与前端总线(FSB)频率的区别:前端总线的速度指的是数

据传输的速度,外频是CPU与主板之间同步运行的速度。也就是说

100MHz外频特指数字脉冲信号在每秒钟震荡一千万次;而100MHz

前端总线指的是每秒钟CPU可接受的数据传输量是100MHz×64bit÷

8Byte/bit=800MB/s

 


  其实现在HyperTransport构架的出现,让这种实际意义上

的前端总线(FSB)频率发生了变化。之前我们知道IA-32架构必须有

三大重要的构件:内存控制器Hub (MCH) ,I/O控制器HubPCI Hub

,像Intel很典型的芯片组 Intel 7501Intel7505芯片组,为双

至强处理器量身定做的,它们所包含的MCHCPU提供了频率为

533MHz的前端总线,配合DDR内存,前端总线带宽可达到4.3GB/

。但随着处理器性能不断提高同时给系统架构带来了很多问题。而

HyperTransport构架不但解决了问题,而且更有效地提高了总

线带宽,比方AMD Opteron处理器,灵活的HyperTransport I/O

线体系结构让它整合了内存控制器,使处理器不通过系统总线传给

芯片组而直接和内存交换数据。这样的话,前端总线(FSB)频率在

AMD Opteron处理器就不知道从何谈起了。

 

 


  4CPU的位和字长

 


  位:在数字电路和电脑技术中采用二进制,代码只有0

1,其中无论是 0或是1CPU中都是 一

 


  字长:电脑技术中对CPU在单位时间内(同一时间)能一次处理

的二进制数的位数叫字长。所以能处理字长为8位数据的CPU通常就

8位的CPU。同理32位的CPU就能在单位时间内处理字长为32位的

二进制数据。字节和字长的区别:由于常用的英文字符用8位二进

制就可以表示,所以通常就将8位称为一个字节。字长的长度是不

固定的,对于不同的CPU、字长的长度也不一样。8位的CPU一次只

能处理一个字节,而32位的CPU一次就能处理4个字节,同理字长为

64位的CPU一次可以处理8个字节。

 


5.倍频系数

 


  倍频系数是指CPU主频与外频之间的相对比例关系。在相同的

外频下,倍频越高CPU的频率也越高。但实际上,在相同外频的前

提下,高倍频的CPU本身意义并不大。这是因为CPU与系统之间数据

传输速度是有限的,一味追求高倍频而得到高主频的CPU就会出现

明显的瓶颈效应CPU从系统中得到数据的极限速度不能够满

CPU运算的速度。一般除了工程样版的IntelCPU都是锁了倍频

的,而AMD之前都没有锁。

 


  6.缓存

 


  缓存大小也是CPU的重要指标之一,而且缓存的结构和大小对

CPU速度的影响非常大,CPU内缓存的运行频率极高,一般是和处理

器同频运作,工作效率远远大于系统内存和硬盘。实际工作时,

CPU往往需要重复读取同样的数据块,而缓存容量的增大,可以大

幅度提升CPU内部读取数据的命中率,而不用再到内存或者硬盘上

寻找,以此提高系统性能。但是由于CPU芯片面积和成本的因素来

考虑,缓存都很小。

 


  L1 Cache(一级缓存)CPU第一层高速缓存,分为数据缓存和

指令缓存。内置的L1高速缓存的容量和结构对CPU的性能影响较大

,不过高速缓冲存储器均由静态RAM组成,结构较复杂,在CPU管芯

面积不能太大的情况下,L1级高速缓存的容量不可能做得太大。一

般服务器CPUL1缓存的容量通常在32256KB

 


  L2 Cache(二级缓存)CPU的第二层高速缓存,分内部和外部

两种芯片。内部的芯片二级缓存运行速度与主频相同,而外部的二

级缓存则只有主频的一半。L2高速缓存容量也会影响CPU的性能,

原则是越大越好,现在家庭用CPU容量最大的是512KB,而服务器和

工作站上用CPUL2高速缓存更高达256-1MB,有的高达2MB或者3MB

 


  L3 Cache(三级缓存),分为两种,早期的是外置,现在的都

是内置的。而它的实际作用即是,L3缓存的应用可以进一步降低内

存延迟,同时提升大数据量计算时处理器的性能。降低内存延迟和

提升大数据量计算能力对游戏都很有帮助。而在服务器领域增加L3

缓存在性能方面仍然有显著的提升。比方具有较大L3缓存的配置利

用物理内存会更有效,故它比较慢的磁盘I/O子系统可以处理更多

的数据请求。具有较大L3缓存的处理器提供更有效的文件系统缓存

行为及较短消息和处理器队列长度。

 


  其实最早的L3缓存被应用在AMD发布的K6-III处理器上,当时

L3缓存受限于制造工艺,并没有被集成进芯片内部,而是集成在

主板上。在只能够和系统总线频率同步的L3缓存同主内存其实差不

了多少。后来使用L3缓存的是英特尔为服务器市场所推出的

Itanium处理器。接着就是P4EE和至强MPIntel还打算推出一款

9MB L3缓存的Itanium2处理器,和以后24MB L3缓存的双核心

Itanium2处理器。

 


  但基本上L3缓存对处理器的性能提高显得不是很重要,比方配

1MB L3缓存的Xeon MP处理器却仍然不是Opteron的对手,由此可

见前端总线的增加,要比缓存增加带来更有效的性能提升。

 


  7.CPU扩展指令集

 


  CPU依靠指令来计算和控制系统,每款CPU在设计时就规定了一

系列与其硬件电路相配合的指令系统。指令的强弱也是CPU的重要

指标,指令集是提高微处理器效率的最有效工具之一。从现阶段的

主流体系结构讲,指令集可分为复杂指令集和精简指令集两部分,

而从具体运用看,如IntelMMXMulti Media Extended)、SSE

、 SSE2Streaming-Single instruction multiple data-

Extensions 2)、SEE3AMD3DNow!等都是CPU的扩展指令集,分

别增强了CPU的多媒体、图形图象和Internet等的处理能力。我们

通常会把CPU的扩展指令集称为"CPU的指令集"SSE3指令集也是目

前规模最小的指令集,此前MMX包含有57条命令,SSE包含有50条命

令,SSE2包含有144条命令,SSE3包含有13条命令。目前SSE3也是

最先进的指令集,英特尔Prescott处理器已经支持SSE3指令集,

AMD会在未来双核心处理器当中加入对SSE3指令集的支持,全美达

的处理器也将支持这一指令集。

 


8.CPU内核和I/O工作电压

 


  从586CPU开始,CPU的工作电压分为内核电压和I/O电压两种,

通常CPU的核心电压小于等于I/O电压。其中内核电压的大小是根据

CPU的生产工艺而定,一般制作工艺越小,内核工作电压越低;I/O

电压一般都在1.6~5V。低电压能解决耗电过大和发热过高的问题。

 

 


  9.制造工艺

 


  制造工艺的微米是指IC内电路与电路之间的距离。制造工艺的

趋势是向密集度愈高的方向发展。密度愈高的IC电路设计,意味着

在同样大小面积的IC中,可以拥有密度更高、功能更复杂的电路设

计。现在主要的180nm130nm90nm。最近官方已经表示有65nm

制造工艺了。

 


10.指令集

 


  (1CISC指令集

 


  CISC指令集,也称为复杂指令集,英文名是CISC,(Complex

Instruction Set Computer的缩写)。在CISC微处理器中,程序的

各条指令是按顺序串行执行的,每条指令中的各个操作也是按顺序

串行执行的。顺序执行的优点是控制简单,但计算机各部分的利用

率不高,执行速度慢。其实它是英特尔生产的x86系列(也就是IA

-32架构)CPU及其兼容CPU,如AMDVIA的。即使是现在新起的

X86-64(也被成AMD64)都是属于CISC的范畴。

 


  要知道什么是指令集还要从当今的X86架构的CPU说起。X86

令集是Intel为其第一块16CPU(i8086)专门开发的,IBM1981年推

出的世界第一台PC机中的CPUi8088(i8086简化版)使用的也是X86

指令,同时电脑中为提高浮点数据处理能力而增加了X87芯片,以

后就将X86指令集和X87指令集统称为X86指令集。

 


  虽然随着CPU技术的不断发展,Intel陆续研制出更新型的

i80386i80486直到过去的PII至强、PIII至强、Pentium 3,最后

到今天的Pentium 4系列、至强(不包括至强Nocona),但为了保

证电脑能继续运行以往开发的各类应用程序以保护和继承丰富的软

件资源,所以Intel公司所生产的所有CPU仍然继续使用X86指令集

,所以它的CPU仍属于X86系列。由于Intel X86系列及其兼容CPU

AMD Athlon MP、)都使用X86指令集,所以就形成了今天庞大的

X86系列及兼容CPU阵容。x86CPU目前主要有intel的服务器CPU

AMD的服务器CPU两类。

 


  (2RISC指令集

 


  RISC是英文Reduced Instruction Set Computing ” 的缩

写,中文意思是精简指令集。它是在CISC指令系统基础上发展

起来的,有人对CISC机进行测试表明,各种指令的使用频度相当悬

殊,最常使用的是一些比较简单的指令,它们仅占指令总数的20

,但在程序中出现的频度却占80%。复杂的指令系统必然增加微处

理器的复杂性,使处理器的研制时间长,成本高。并且复杂指令需

要复杂的操作,必然会降低计算机的速度。基于上述原因,20世纪

80年代RISCCPU诞生了,相对于CISCCPU ,RISCCPU不仅精简

了指令系统,还采用了一种叫做超标量和超流水线结构,大大

增加了并行处理能力。RISC指令集是高性能CPU的发展方向。它与

传统的CISC(复杂指令集)相对。相比而言,RISC的指令格式统一,

种类比较少,寻址方式也比复杂指令集少。当然处理速度就提高很

多了。目前在中高档服务器中普遍采用这一指令系统的CPU,特别

是高档服务器全都采用RISC指令系统的CPURISC指令系统更加适

合高档服务器的操作系统UNIX,现在Linux也属于类似UNIX的操作

系统。RISCCPUIntelAMDCPU在软件和硬件上都不兼容。

 


  目前,在中高档服务器中采用RISC指令的CPU主要有以下几类

PowerPC处理器、SPARC处理器、PA-RISC处理器、MIPS处理器、

Alpha处理器。

 


  (3IA-64

 


  EPICExplicitly Parallel Instruction Computers,精确

并行指令计算机)是否是RISCCISC体系的继承者的争论已经有很

多,单以EPIC体系来说,它更像Intel的处理器迈向RISC体系的重

要步骤。从理论上说,EPIC体系设计的CPU,在相同的主机配置下

,处理Windows的应用软件比基于Unix下的应用软件要好得多。

Intel采用EPIC技术的服务器CPU是安腾Itanium(开发代号即

Merced)。它是64位处理器,也是IA64系列中的第一款。微软也

已开发了代号为Win64的操作系统,在软件上加以支持。在Intel

用了X86指令集之后,它又转而寻求更先进的64-bit微处理器,

Intel这样做的原因是,?窍氚谕讶萘烤薮蟮膞86架构,从而引入精

力充沛而又功能强大的指令集,于是采用EPIC指令集的IA-64架构

便诞生了。IA-64 在很多方面来说,都比x86有了长足的进步。突

破了传统IA32架构的许多限制,在数据的处理能力,系统的稳定性

、安全性、可用性、可观理性等方面获得了突破性的提高。

 


  IA-64微处理器最大的缺陷是它们缺乏与x86的兼容,而Intel

为了IA-64处理器能够更好地运行两个朝代的软件,它在IA-64处理

器上(ItaniumItanium2 ……)引入了x86-to-IA-64的解码器,

这样就能够把x86指令翻译为IA-64指令。这个解码器并不是最有效

率的解码器,也不是运行x86代码的最好途径(最好的途径是直接

x86处理器上运行x86代码),因此Itanium Itanium2在运行

x86应用程序时候的性能非常糟糕。这也成为X86-64产生的根本原

因。 .

 


  (4X86-64 AMD64 / EM64T

 


  AMD公司设计,可以在同一时间内处理64位的整数运算,并兼

容于X86-32架构。其中支持64位逻辑定址,同时提供转换为32位定

址选项;但数据操作指令默认为32位和8位,提供转换成64位和16

位的选项;支持常规用途寄存器,如果是32位运算操作,就要将结

果扩展成完整的64位。这样,指令中有直接执行转换执行

的区别,其指令字段是8位或32位,可以避免字段过长。

 


  x86-64(也叫AMD64)的产生也并非空穴来风,x86处理器的

32bit寻址空间限制在4GB内存,而IA-64的处理器又不能兼容x86

AMD充分考虑顾客的需求,加强x86指令集的功能,使这套指令集可

同时支持64位的运算模式,因此AMD把它们的结构称之为x86-64

在技术上AMDx86-64架构中为了进行64位运算,AMD为其引入了新

增了R8-R15通用寄存器作为原有X86处理器寄存器的扩充,但在而

32位环境下并不完全使用到这些寄存器。原来的寄存器诸如EAX

EBX也由32位扩张至64位。在SSE单元中新加入了8个新寄存器以

提供对SSE2的支持。寄存器数量的增加将带来性能的提升。与此同

时,为了同时支持3264位代码及寄存器,x86-64架构允许处理器

工作在以下两种模式:Long Mode(长模式)Legacy Mode(遗传模

)Long模式又分为两种子模式(64bit模式和Compatibility

mode兼容模式)。该标准已经被引进在AMD服务器处理器中的

Opteron处理器。

 


  而今年也推出了支持64位的EM64T技术,再还没被正式命为

EM64T之前是IA32E,这是英特尔64位扩展技术的名字,用来区别X86

指令集。IntelEM64T支持64sub-mode,和AMDX86-64技术类

似,采用64位的线性平面寻址,加入8个新的通用寄存器(GPRs

,还增加8个寄存器支持SSE指令。与AMD相类似,Intel64位技术

将兼容IA32IA32E,只有在运行64位操作系统下的时候,才将会

采用IA32EIA32E将由2sub-mode组成:64sub-mode32

sub-mode,同AMD64一样是向下兼容的。IntelEM64T将完全兼容

AMDX86-64技术。现在Nocona处理器已经加入了一些64位技术,

IntelPentium 4E处理器也支持64位技术。

 


构,但EM64TAMD64还是有一些不一样的地方,AMD64处理器中的

NX位在Intel的处理器中将没有提供。

 


11.超流水线与超标量

 


  在解释超流水线与超标量前,先了解流水线(pipeline)。流水

线是Intel首次在486芯片中开始使用的。流水线的工作方式就象工

业生产上的装配流水线。在CPU中由56个不同功能的电路单元组

成一条指令处理流水线,然后将一条X86指令分成56步后再由这

些电路单元分别执行,这样就能实现在一个CPU时钟周期完成一条

指令,因此提高CPU的运算速度。经典奔腾每条整数流水线都分为

四级流水,即指令预取、译码、执行、写回结果,浮点流水又分为

八级流水。构建一套SMP系统的必要条件是:支持SMP的硬件包括主

板和CPU;支持SMP的系统平台,再就是支持SMP的应用软件。

 


  为了能够使得SMP系统发挥高效的性能,操作系统必须支持SMP

系统,如WINNTLINUX、以及UNIX等等32位操作系统。即能够进行

多任务和多线程处理。多任务是指操作系统能够在同一时间让不同

CPU完成不同的任务;多线程是指操作系统能够使得不同的CPU

行的完成同一个任务。

 


  要组建SMP系统,对所选的CPU有很高的要求,首先、CPU内部

必须内置APICAdvanced Programmable Interrupt Controllers

)单元。Intel 多处理规范的核心就是高级可编程中断控制器

Advanced Programmable Interrupt Controllers--APICs)的使

用;再次,相同的产品型号,同样类型的CPU核心,完全相同的运

行频率;最后,尽可能保持相同的产品序列编号,因为两个生产批

次的CPU作为双处理器运行的时候,有可能会发生一颗CPU负担过高

,而另一颗负担很少的情况,无法发挥最大性能,更糟糕的是可能

导致死机。

 


  16NUMA技术

 


  NUMA即非一致访问分布共享存储技术,它是由若干通过高速专

用网络连接起来的独立节点构成的系统,各个节点可以是单个的

CPU或是SMP系统。在NUMA中,Cache 的一致性有多种解决方案,需

要操作系统和特殊软件的支持。图2中是Sequent公司NUMA系统的例

子。这里有3SMP模块用高速专用网络联起来,组成一个节点,每

个节点可以有12CPU。像Sequent的系统最多可以达到64CPU

256CPU。显然,这是在SMP的基础上,再用NUMA的技术加以扩

展,是这两种技术的结合。

 


  17、乱序执行技术 )

 


  乱序执行(out-of-orderexecution),是指CPU允许将多条指

令不按程序规定的顺序分开发送给各相应电路单元处理的技术。这

样将根据个电路单元的状态和各指令能否提前执行的具体情况分析

后,将能提前执行的指令立即发送给相应电路单元执行,在这期间

不按规定顺序执行指令,然后由重新排列单元将各执行单元结果按

指令顺序重新排列。采用乱序执行技术的目的是为了使CPU内部电

路满负荷运转并相应提高了CPU的运行程序的速度。分枝技术:

branch)指令进行运算时需要等待结果,一般无条件分枝只需要

按指令顺序执行,而条件分枝必须根据处理后的结果,再决定是否

按原先顺序进行。

 


  18CPU内部的内存控制器

 


  许多应用程序拥有更为复杂的读取模式(几乎是随机地,特别

是当cache hit不可预测的时候),并且没有有效地利用带宽。典

型的这类应用程序就是业务处理软件,即使拥有如乱序执行(out

of order execution)这样的CPU特性,也会受内存延迟的限制。

这样CPU必须得等到运算所需数据被除数装载完成才能执行指令(

无论这些数据来自CPU cache还是主内存系统)。当前低段系统的

内存延迟大约是120150ns,而CPU速度则达到了3GHz以上,一次

单独的内存请求可能会浪费200300CPU循环。即使在缓存命中

率(cache hit rate)达到99%的情况下,CPU也可能会花50%的

时间来等待内存请求的结束- 比如因为内存延迟的缘故。

 


  你可以看到Opteron整合的内存控制器,它的延迟,与芯片组

支持双通道DDR内存控制器的延迟相比来说,是要低很多的。英特

尔也按照计划的那样在处理器内部整合内存控制器,这样导致北桥

芯片将变得不那么重要。但改变了处理器访问主存的方式,有助于

提高带宽、降低内存延时和提升处理器性能。

 

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多