英特尔I3、I5、I7处理器的参数各是什么?相互的比较与差异各是什么?还有价钱的差异?越详细越好,谢谢 最佳答案 EDCD05619_313 - 二副 十一级 酷睿i3 基本参数 生产厂商 intel 处理器架构 Intel系列 CPU类型 台式机 CPU型号 酷睿 i3 530 CPU系列 Intel Core i3 制造工艺 32纳米 CPU核心数量 双核心 cpu内核 Westmere cpu接口 LGA 1156 [编辑本段]技术参数 主频 2.93ghz 二级缓存(KB) 2*256KB 三级缓存(KB) 4MB 超线程 4线程数 酷睿i5 Lynnfield的降临 面对着价格昂贵的Core i7,新架构处理器很难走进广大消费者的生活之中,不过近日曝光了又一款基于Nehalem架构的双核处理器,其依旧采用整合内存控制器,三级缓存模式,L3达到8MB,支持Turbo Boost等技术的新处理器——Core i5酷睿I5。Core i5 采用的是成熟的DMI(Direct Media Interface),相当于内部集成所有北桥的功能,采用DMI用于准南桥通信,并且只支持三通道的DDR3内存。结构上它用的是LGA1160(后改为LGA1156)接口,Core i7用的是LGA1366。 英特尔将Lynnfield定位于200美元以下的主流市场,计划是在明年3季度才推出,不久前台湾网友曾放出过Lynnfield的实物照,现在国内一位网友放出了Lynnfield的部分测试成绩。 测试中使用的Lynnfield频率为2.13GHz,其它配件为笔记本DDR3-1066(4G+2G)内存,笔记本ST 7200.2 160G硬盘以及PCI-E X1的NVS290显卡,操作系统为Windows Vista Ultimate 64bit,这是一个桌面PC,不过配件大多是笔记本用的。 由于缺乏对比数据,所以很难对Lynnfield的性能作一个定量的判断,简单的比较而言,离3.2GHz的Core i7-965的差距很大。 在CPU-Z中,直接将Lynnfield识别为Intel Core i5,这是一个有趣的信息,英特尔一直称Core i7这个名字无任何实际意义,只是好听罢了,现在看来不能尽信,那谁又将是Core i6呢,Havendale似乎是最接近的答案。 但Lynnfield不全等于酷睿I5 09年六月,英特尔公关部主任BILL CALDER详细描述了英特尔消费级桌面处理器的品牌体系,并且公布了CORE I5 CORE I3两个子品牌。 Lynnfield的确会与CORE I5有一定关联,但是不会一刀切,支持HT的Lynnfield和移动版Lynnfield将归于酷睿I7系列。尔不支持HT的Lynnfield,会被归于酷睿I5系列。 据悉,首批上市的Lynnfield,会有2.93G 2.8G 2.66G三个版本,其中前两种会支持HT,可能归于酷睿I7系列。 I5应该是最终取代老迈的酷睿2四核的产品。酷睿i7 产品图片Intel官方正式确认,基于全新Nehalem架构的新一代桌面处理器将沿用“Core”(酷睿)名称,命名为“Intel Core i7”系列,至尊版的名称是“Intel Core i7 Extreme”系列。而同架构服务器处理器将继续延用“Xeon”名称。至于为什么是“I7”,而不是大多数人认为的“Core 3”,Intel方面还没给出详细的解释,估计意思是Intel的第七代处理器,但2000年推出NetBrust架构的Pentium 4处理器应该是属于第七代产品的,真正解释还是等Intel的回答吧。 Intel Core i7是一款45nm原生四核处理器,处理器拥有8MB三级缓存,支持三通道 DDR3内存。处理器采用LGA 1366针脚设计,支持第二代超线程技术,也就是处理器能以八线程运行。根据网上流传的测试,同频Core i7比Core 2 Quad性能要高出很多。 英特尔首先会发布三款Intel Core i7处理器,频率分别为3.2GHz、2.93GHz和2.66GHz,主频为3.2GHz的属于Intel Core i7 Extreme,处理器售价为999美元,当然这款顶级处理器面向的是发烧级用户。而频率较低的2.66GHz的定价为284美元,约合1940元人民币,面向的是普通消费者。Intel 对于CPU基本知识的讲解 2008-7-30 21:12 提问者:dmcpoorness |悬赏分:5|浏览次数:1423次 包括GHz,一二级缓存,频率,缓存容量,MHz等CPU基本 菜鸟了解!!!!! 最好是整理好复制下来的,不要给个网站!!!! 2008-7-30 21:19 最佳答案 CPU 参数详解 CPU是Central Processing Unit(中央处理器)的缩写,CPU一般由逻辑运算单元、控制单元和存储单元组成。在逻辑运算和控制单元中包括一些寄存器,这些寄存器用于CPU在处理数据过程中数据的暂时保存。大家需要重点了解的CPU主要指标/参数有: 1.主频 主频,也就是CPU的时钟频率,简单地说也就是CPU的工作频率,例如我们常说的P4(奔四)1.8GHz,这个1.8GHz(1800MHz)就是CPU的主频。一般说来,一个时钟周期完成的指令数是固定的,所以主频越高,CPU的速度也就越快。主频=外频X倍频。 此外,需要说明的是AMD的Athlon XP系列处理器其主频为PR(Performance Rating)值标称,例如Athlon XP 1700+和1800+。举例来说,实际运行频率为1.53GHz的Athlon XP标称为1800+,而且在系统开机的自检画面、Windows系统的系统属性以及WCPUID等检测软件中也都是这样显示的。 2.外频 外频即CPU的外部时钟频率,主板及CPU标准外频主要有66MHz、100MHz、133MHz几种。此外主板可调的外频越多、越高越好,特别是对于超频者比较有用。 3.倍频 倍频则是指CPU外频与主频相差的倍数。例如Athlon XP 2000+的CPU,其外频为133MHz,所以其倍频为12.5倍。 4.接口 接口指CPU和主板连接的接口。主要有两类,一类是卡式接口,称为SLOT,卡式接口的CPU像我们经常用的各种扩展卡,例如显卡、声卡等一样是竖立插到主板上的,当然主板上必须有对应SLOT插槽,这种接口的CPU目前已被淘汰。另一类是主流的针脚式接口,称为Socket,Socket接口的CPU有数百个针脚,因为针脚数目不同而称为Socket370、Socket478、Socket462、Socket423等。 5.缓存 缓存就是指可以进行高速数据交换的存储器,它先于内存与CPU交换数据,因此速度极快,所以又被称为高速缓存。与处理器相关的缓存一般分为两种——L1缓存,也称内部缓存;和L2缓存,也称外部缓存。例如Pentium4“Willamette”内核产品采用了423的针脚架构,具备400MHz的前端总线,拥有256KB全速二级缓存,8KB一级追踪缓存,SSE2指令集。 内部缓存(L1 Cache) 也就是我们经常说的一级高速缓存。在CPU里面内置了高速缓存可以提高CPU的运行效率,内置的L1高速缓存的容量和结构对CPU的性能影响较大,L1缓存越大,CPU工作时与存取速度较慢的L2缓存和内存间交换数据的次数越少,相对电脑的运算速度可以提高。不过高速缓冲存储器均由静态RAM组成,结构较复杂,在CPU管芯面积不能太大的情况下,L1级高速缓存的容量不可能做得太大,L1缓存的容量单位一般为KB。 外部缓存(L2 Cache) CPU外部的高速缓存,外部缓存成本昂贵,所以Pentium 4 Willamette核心为外部缓存256K,但同样核心的赛扬4代只有128K。 6.多媒体指令集 为了提高计算机在多媒体、3D图形方面的应用能力,许多处理器指令集应运而生,其中最著名的三种便是Intel的MMX、SSE/SSE2和AMD的3D NOW!指令集。理论上这些指令对目前流行的图像处理、浮点运算、3D运算、视频处理、音频处理等诸多多媒体应用起到全面强化的作用。 7.制造工艺 早期的处理器都是使用0.5微米工艺制造出来的,随着CPU频率的增加,原有的工艺已无法满足产品的要求,这样便出现了0.35微米以及0.25微米工艺。制作工艺越精细意味着单位体积内集成的电子元件越多,而现在,采用0.18微米和0.13微米制造的处理器产品是市场上的主流,例如Northwood核心P4采用了0.13微米生产工艺。而在2003年,Intel和AMD的CPU的制造工艺会达到0.09毫米。 8.电压(Vcore) CPU的工作电压指的也就是CPU正常工作所需的电压,与制作工艺及集成的晶体管数相关。正常工作的电压越低,功耗越低,发热减少。CPU的发展方向,也是在保证性能的基础上,不断降低正常工作所需要的电压。例如老核心Athlon XP的工作电压为1.75v,而新核心的Athlon XP其电压为1.65v 9.封装形式 所谓CPU封装是CPU生产过程中的最后一道工序,封装是采用特定的材料将CPU芯片或CPU模块固化在其中以防损坏的保护措施,一般必须在封装后CPU才能交付用户使用。CPU的封装方式取决于CPU安装形式和器件集成设计,从大的分类来看通常采用Socket插座进行安装的CPU使用PGA(栅格阵列)方式封装,而采用Slot x槽安装的CPU则全部采用SEC(单边接插盒)的形式封装。现在还有PLGA(Plastic Land Grid Array)、OLGA(Organic Land Grid Array)等封装技术。由于市场竞争日益激烈,目前CPU封装技术的发展方向以节约成本为主。 10.整数单元和浮点单元 ALU—运算逻辑单元,这就是我们所说的“整数”单元。数学运算如加减乘除以及逻辑运算如“OR、AND、ASL、ROL”等指令都在逻辑运算单元中执行。在多数的软件程序中,这些运算占了程序代码的绝大多数。 而浮点运算单元FPU(Floating Point Unit)主要负责浮点运算和高精度整数运算。有些FPU还具有向量运算的功能,另外一些则有专门的向量处理单元。 整数处理能力是CPU运算速度最重要的体现,但浮点运算能力是关系到CPU的多媒体、3D图形处理的一个重要指标,所以对于现代CPU而言浮点单元运算能力的强弱更能显示CPU的性能。 CPU内核: 核心(Die)又称为内核,是CPU最重要的组成部分。CPU中心那块隆起的芯片就是核心,是由单晶硅以一定的生产工艺制造出来的,CPU所有的计算、接受/存储命令、处理数据都由核心执行。各种CPU核心都具有固定的逻辑结构,一级缓存、二级缓存、执行单元、指令级单元和总线接口等逻辑单元都会有科学的布局。 为了便于CPU设计、生产、销售的管理,CPU制造商会对各种CPU核心给出相应的代号,这也就是所谓的CPU核心类型。 不同的CPU(不同系列或同一系列)都会有不同的核心类型(例如Pentium 4的Northwood,Willamette以及K6-2的CXT和K6-2+的ST-50等等),甚至同一种核心都会有不同版本的类型(例如Northwood核心就分为B0和C1等版本),核心版本的变更是为了修正上一版存在的一些错误,并提升一定的性能,而这些变化普通消费者是很少去注意的。每一种核心类型都有其相应的制造工艺(例如0.25um、0.18um、0.13um以及0.09um等)、核心面积(这是决定CPU成本的关键因素,成本与核心面积基本上成正比)、核心电压、电流大小、晶体管数量、各级缓存的大小、主频范围、流水线架构和支持的指令集(这两点是决定CPU实际性能和工作效率的关键因素)、功耗和发热量的大小、封装方式(例如S.E.P、PGA、FC-PGA、FC-PGA2等等)、接口类型(例如Socket 370,Socket A,Socket 478,Socket T,Slot 1、Socket 940等等)、前端总线频率(FSB)等等。因此,核心类型在某种程度上决定了CPU的工作性能。 一般说来,新的核心类型往往比老的核心类型具有更好的性能(例如同频的Northwood核心Pentium 4 1.8A GHz就要比Willamette核心的Pentium 4 1.8GHz性能要高),但这也不是绝对的,这种情况一般发生在新核心类型刚推出时,由于技术不完善或新的架构和制造工艺不成熟等原因,可能会导致新的核心类型的性能反而还不如老的核心类型的性能。例如,早期Willamette核心Socket 423接口的Pentium 4的实际性能不如Socket 370接口的Tualatin核心的Pentium III和赛扬,现在的低频Prescott核心Pentium 4的实际性能不如同频的Northwood核心Pentium 4等等,但随着技术的进步以及CPU制造商对新核心的不断改进和完善,新核心的中后期产品的性能必然会超越老核心产品。 CPU讲解,教你如何辨别CPU! 2008-09-12 10:07| (分类:默认分类) 这18条背下来没人敢和你忽悠CPU 1.主频
CPU的主频=外频×倍频系数。很多人认为主频就决定着CPU的运行 速度,这不仅是个片面的,而且对于服务器来讲,这个认识也出现 了偏差。至今,没有一条确定的公式能够实现主频和实际的运算速 度两者之间的数值关系,即使是两大处理器厂家Intel和AMD,在这 点上也存在着很大的争议,我们从Intel的产品的发展趋势,可以 看出Intel很注重加强自身主频的发展。像其他的处理器厂家,有 人曾经拿过一快1G的全美达来做比较,它的运行效率相当于2G的 Intel处理器。 所以,CPU的主频与CPU实际的运算能力是没有直接关系的,主 频表示在CPU内数字脉冲信号震荡的速度。在Intel的处理器产品中 ,我们也可以看到这样的例子:1 GHz Itanium芯片能够表现得差 不多跟2.66 GHz Xeon/Opteron一样快,或是1.5 GHz Itanium 2大 约跟4 GHz Xeon/Opteron一样快。CPU的运算速度还要看CPU的流水 线的各方面的性能指标。
CPU性能表现的一个方面,而不代表CPU的整体性能。
主板的运行速度。说白了,在台式机中,我们所说的超频,都是超 CPU的外频(当然一般情况下,CPU的倍频都是被锁住的)相信这点 是很好理解的。但对于服务器CPU来讲,超频是绝对不允许的。前 面说到CPU决定着主板的运行速度,两者是同步运行的,如果把服 务器CPU超频了,改变了外频,会产生异步运行,(台式机很多主 板都支持异步运行)这样会造成整个服务器系统的不稳定。
行的速度,在这种方式下,可以理解为CPU的外频直接与内存相连 通,实现两者间的同步运行状态。外频与前端总线(FSB)频率很容 易被混为一谈,下面的前端总线介绍我们谈谈两者的区别。
据交换速度。有一条公式可以计算,即数据带宽=(总线频率×数 据带宽)/8,数据传输最大带宽取决于所有同时传输的数据的宽度 和传输频率。比方,现在的支持64位的至强Nocona,前端总线是 800MHz,按照公式,它的数据传输最大带宽是6.4GB/秒。
据传输的速度,外频是CPU与主板之间同步运行的速度。也就是说 ,100MHz外频特指数字脉冲信号在每秒钟震荡一千万次;而100MHz 前端总线指的是每秒钟CPU可接受的数据传输量是100MHz×64bit÷ 8Byte/bit=800MB/s。
的前端总线(FSB)频率发生了变化。之前我们知道IA-32架构必须有 三大重要的构件:内存控制器Hub (MCH) ,I/O控制器Hub和PCI Hub ,像Intel很典型的芯片组 Intel 7501、Intel7505芯片组,为双 至强处理器量身定做的,它们所包含的MCH为CPU提供了频率为 533MHz的前端总线,配合DDR内存,前端总线带宽可达到4.3GB/秒 。但随着处理器性能不断提高同时给系统架构带来了很多问题。而 “HyperTransport”构架不但解决了问题,而且更有效地提高了总 线带宽,比方AMD Opteron处理器,灵活的HyperTransport I/O总 线体系结构让它整合了内存控制器,使处理器不通过系统总线传给 芯片组而直接和内存交换数据。这样的话,前端总线(FSB)频率在 AMD Opteron处理器就不知道从何谈起了。
“1”,其中无论是 “0”或是“1”在CPU中都是 一“位”。
的二进制数的位数叫字长。所以能处理字长为8位数据的CPU通常就 叫8位的CPU。同理32位的CPU就能在单位时间内处理字长为32位的 二进制数据。字节和字长的区别:由于常用的英文字符用8位二进 制就可以表示,所以通常就将8位称为一个字节。字长的长度是不 固定的,对于不同的CPU、字长的长度也不一样。8位的CPU一次只 能处理一个字节,而32位的CPU一次就能处理4个字节,同理字长为 64位的CPU一次可以处理8个字节。
外频下,倍频越高CPU的频率也越高。但实际上,在相同外频的前 提下,高倍频的CPU本身意义并不大。这是因为CPU与系统之间数据 传输速度是有限的,一味追求高倍频而得到高主频的CPU就会出现 明显的“瓶颈”效应—CPU从系统中得到数据的极限速度不能够满 足CPU运算的速度。一般除了工程样版的Intel的CPU都是锁了倍频 的,而AMD之前都没有锁。
CPU速度的影响非常大,CPU内缓存的运行频率极高,一般是和处理 器同频运作,工作效率远远大于系统内存和硬盘。实际工作时, CPU往往需要重复读取同样的数据块,而缓存容量的增大,可以大 幅度提升CPU内部读取数据的命中率,而不用再到内存或者硬盘上 寻找,以此提高系统性能。但是由于CPU芯片面积和成本的因素来 考虑,缓存都很小。
指令缓存。内置的L1高速缓存的容量和结构对CPU的性能影响较大 ,不过高速缓冲存储器均由静态RAM组成,结构较复杂,在CPU管芯 面积不能太大的情况下,L1级高速缓存的容量不可能做得太大。一 般服务器CPU的L1缓存的容量通常在32—256KB。
两种芯片。内部的芯片二级缓存运行速度与主频相同,而外部的二 级缓存则只有主频的一半。L2高速缓存容量也会影响CPU的性能, 原则是越大越好,现在家庭用CPU容量最大的是512KB,而服务器和 工作站上用CPU的L2高速缓存更高达256-1MB,有的高达2MB或者3MB 。
是内置的。而它的实际作用即是,L3缓存的应用可以进一步降低内 存延迟,同时提升大数据量计算时处理器的性能。降低内存延迟和 提升大数据量计算能力对游戏都很有帮助。而在服务器领域增加L3 缓存在性能方面仍然有显著的提升。比方具有较大L3缓存的配置利 用物理内存会更有效,故它比较慢的磁盘I/O子系统可以处理更多 的数据请求。具有较大L3缓存的处理器提供更有效的文件系统缓存 行为及较短消息和处理器队列长度。
的L3缓存受限于制造工艺,并没有被集成进芯片内部,而是集成在 主板上。在只能够和系统总线频率同步的L3缓存同主内存其实差不 了多少。后来使用L3缓存的是英特尔为服务器市场所推出的 Itanium处理器。接着就是P4EE和至强MP。Intel还打算推出一款 9MB L3缓存的Itanium2处理器,和以后24MB L3缓存的双核心 Itanium2处理器。
备1MB L3缓存的Xeon MP处理器却仍然不是Opteron的对手,由此可 见前端总线的增加,要比缓存增加带来更有效的性能提升。
系列与其硬件电路相配合的指令系统。指令的强弱也是CPU的重要 指标,指令集是提高微处理器效率的最有效工具之一。从现阶段的 主流体系结构讲,指令集可分为复杂指令集和精简指令集两部分, 而从具体运用看,如Intel的MMX(Multi Media Extended)、SSE 、 SSE2(Streaming-Single instruction multiple data- Extensions 2)、SEE3和AMD的3DNow!等都是CPU的扩展指令集,分 别增强了CPU的多媒体、图形图象和Internet等的处理能力。我们 通常会把CPU的扩展指令集称为"CPU的指令集"。SSE3指令集也是目 前规模最小的指令集,此前MMX包含有57条命令,SSE包含有50条命 令,SSE2包含有144条命令,SSE3包含有13条命令。目前SSE3也是 最先进的指令集,英特尔Prescott处理器已经支持SSE3指令集, AMD会在未来双核心处理器当中加入对SSE3指令集的支持,全美达 的处理器也将支持这一指令集。
通常CPU的核心电压小于等于I/O电压。其中内核电压的大小是根据 CPU的生产工艺而定,一般制作工艺越小,内核工作电压越低;I/O 电压一般都在1.6~5V。低电压能解决耗电过大和发热过高的问题。
趋势是向密集度愈高的方向发展。密度愈高的IC电路设计,意味着 在同样大小面积的IC中,可以拥有密度更高、功能更复杂的电路设 计。现在主要的180nm、130nm、90nm。最近官方已经表示有65nm的 制造工艺了。
Instruction Set Computer的缩写)。在CISC微处理器中,程序的 各条指令是按顺序串行执行的,每条指令中的各个操作也是按顺序 串行执行的。顺序执行的优点是控制简单,但计算机各部分的利用 率不高,执行速度慢。其实它是英特尔生产的x86系列(也就是IA -32架构)CPU及其兼容CPU,如AMD、VIA的。即使是现在新起的 X86-64(也被成AMD64)都是属于CISC的范畴。
令集是Intel为其第一块16位CPU(i8086)专门开发的,IBM1981年推 出的世界第一台PC机中的CPU—i8088(i8086简化版)使用的也是X86 指令,同时电脑中为提高浮点数据处理能力而增加了X87芯片,以 后就将X86指令集和X87指令集统称为X86指令集。
i80386、i80486直到过去的PII至强、PIII至强、Pentium 3,最后 到今天的Pentium 4系列、至强(不包括至强Nocona),但为了保 证电脑能继续运行以往开发的各类应用程序以保护和继承丰富的软 件资源,所以Intel公司所生产的所有CPU仍然继续使用X86指令集 ,所以它的CPU仍属于X86系列。由于Intel X86系列及其兼容CPU( 如AMD Athlon MP、)都使用X86指令集,所以就形成了今天庞大的 X86系列及兼容CPU阵容。x86CPU目前主要有intel的服务器CPU和 AMD的服务器CPU两类。
写,中文意思是“精简指令集”。它是在CISC指令系统基础上发展 起来的,有人对CISC机进行测试表明,各种指令的使用频度相当悬 殊,最常使用的是一些比较简单的指令,它们仅占指令总数的20% ,但在程序中出现的频度却占80%。复杂的指令系统必然增加微处 理器的复杂性,使处理器的研制时间长,成本高。并且复杂指令需 要复杂的操作,必然会降低计算机的速度。基于上述原因,20世纪 80年代RISC型CPU诞生了,相对于CISC型CPU ,RISC型CPU不仅精简 了指令系统,还采用了一种叫做“超标量和超流水线结构”,大大 增加了并行处理能力。RISC指令集是高性能CPU的发展方向。它与 传统的CISC(复杂指令集)相对。相比而言,RISC的指令格式统一, 种类比较少,寻址方式也比复杂指令集少。当然处理速度就提高很 多了。目前在中高档服务器中普遍采用这一指令系统的CPU,特别 是高档服务器全都采用RISC指令系统的CPU。RISC指令系统更加适 合高档服务器的操作系统UNIX,现在Linux也属于类似UNIX的操作 系统。RISC型CPU与Intel和AMD的CPU在软件和硬件上都不兼容。
:PowerPC处理器、SPARC处理器、PA-RISC处理器、MIPS处理器、 Alpha处理器。
并行指令计算机)是否是RISC和CISC体系的继承者的争论已经有很 多,单以EPIC体系来说,它更像Intel的处理器迈向RISC体系的重 要步骤。从理论上说,EPIC体系设计的CPU,在相同的主机配置下 ,处理Windows的应用软件比基于Unix下的应用软件要好得多。 Intel采用EPIC技术的服务器CPU是安腾Itanium(开发代号即 Merced)。它是64位处理器,也是IA-64系列中的第一款。微软也 已开发了代号为Win64的操作系统,在软件上加以支持。在Intel采 用了X86指令集之后,它又转而寻求更先进的64-bit微处理器, Intel这样做的原因是,?窍氚谕讶萘烤薮蟮膞86架构,从而引入精 力充沛而又功能强大的指令集,于是采用EPIC指令集的IA-64架构 便诞生了。IA-64 在很多方面来说,都比x86有了长足的进步。突 破了传统IA32架构的许多限制,在数据的处理能力,系统的稳定性 、安全性、可用性、可观理性等方面获得了突破性的提高。
为了IA-64处理器能够更好地运行两个朝代的软件,它在IA-64处理 器上(Itanium、Itanium2 ……)引入了x86-to-IA-64的解码器, 这样就能够把x86指令翻译为IA-64指令。这个解码器并不是最有效 率的解码器,也不是运行x86代码的最好途径(最好的途径是直接 在x86处理器上运行x86代码),因此Itanium 和Itanium2在运行 x86应用程序时候的性能非常糟糕。这也成为X86-64产生的根本原 因。 .
容于X86-32架构。其中支持64位逻辑定址,同时提供转换为32位定 址选项;但数据操作指令默认为32位和8位,提供转换成64位和16 位的选项;支持常规用途寄存器,如果是32位运算操作,就要将结 果扩展成完整的64位。这样,指令中有“直接执行”和“转换执行 ”的区别,其指令字段是8位或32位,可以避免字段过长。
32bit寻址空间限制在4GB内存,而IA-64的处理器又不能兼容x86。 AMD充分考虑顾客的需求,加强x86指令集的功能,使这套指令集可 同时支持64位的运算模式,因此AMD把它们的结构称之为x86-64。 在技术上AMD在x86-64架构中为了进行64位运算,AMD为其引入了新 增了R8-R15通用寄存器作为原有X86处理器寄存器的扩充,但在而 在32位环境下并不完全使用到这些寄存器。原来的寄存器诸如EAX 、EBX也由32位扩张至64位。在SSE单元中新加入了8个新寄存器以 提供对SSE2的支持。寄存器数量的增加将带来性能的提升。与此同 时,为了同时支持32和64位代码及寄存器,x86-64架构允许处理器 工作在以下两种模式:Long Mode(长模式)和Legacy Mode(遗传模 式),Long模式又分为两种子模式(64bit模式和Compatibility mode兼容模式)。该标准已经被引进在AMD服务器处理器中的 Opteron处理器。
EM64T之前是IA32E,这是英特尔64位扩展技术的名字,用来区别X86 指令集。Intel的EM64T支持64位sub-mode,和AMD的X86-64技术类 似,采用64位的线性平面寻址,加入8个新的通用寄存器(GPRs) ,还增加8个寄存器支持SSE指令。与AMD相类似,Intel的64位技术 将兼容IA32和IA32E,只有在运行64位操作系统下的时候,才将会 采用IA32E。IA32E将由2个sub-mode组成:64位sub-mode和32位 sub-mode,同AMD64一样是向下兼容的。Intel的EM64T将完全兼容 AMD的X86-64技术。现在Nocona处理器已经加入了一些64位技术, Intel的Pentium 4E处理器也支持64位技术。
NX位在Intel的处理器中将没有提供。
线是Intel首次在486芯片中开始使用的。流水线的工作方式就象工 业生产上的装配流水线。在CPU中由5—6个不同功能的电路单元组 成一条指令处理流水线,然后将一条X86指令分成5—6步后再由这 些电路单元分别执行,这样就能实现在一个CPU时钟周期完成一条 指令,因此提高CPU的运算速度。经典奔腾每条整数流水线都分为 四级流水,即指令预取、译码、执行、写回结果,浮点流水又分为 八级流水。构建一套SMP系统的必要条件是:支持SMP的硬件包括主 板和CPU;支持SMP的系统平台,再就是支持SMP的应用软件。
系统,如WINNT、LINUX、以及UNIX等等32位操作系统。即能够进行 多任务和多线程处理。多任务是指操作系统能够在同一时间让不同 的CPU完成不同的任务;多线程是指操作系统能够使得不同的CPU并 行的完成同一个任务。
必须内置APIC(Advanced Programmable Interrupt Controllers )单元。Intel 多处理规范的核心就是高级可编程中断控制器 (Advanced Programmable Interrupt Controllers--APICs)的使 用;再次,相同的产品型号,同样类型的CPU核心,完全相同的运 行频率;最后,尽可能保持相同的产品序列编号,因为两个生产批 次的CPU作为双处理器运行的时候,有可能会发生一颗CPU负担过高 ,而另一颗负担很少的情况,无法发挥最大性能,更糟糕的是可能 导致死机。
用网络连接起来的独立节点构成的系统,各个节点可以是单个的 CPU或是SMP系统。在NUMA中,Cache 的一致性有多种解决方案,需 要操作系统和特殊软件的支持。图2中是Sequent公司NUMA系统的例 子。这里有3个SMP模块用高速专用网络联起来,组成一个节点,每 个节点可以有12个CPU。像Sequent的系统最多可以达到64个CPU甚 至256个CPU。显然,这是在SMP的基础上,再用NUMA的技术加以扩 展,是这两种技术的结合。
令不按程序规定的顺序分开发送给各相应电路单元处理的技术。这 样将根据个电路单元的状态和各指令能否提前执行的具体情况分析 后,将能提前执行的指令立即发送给相应电路单元执行,在这期间 不按规定顺序执行指令,然后由重新排列单元将各执行单元结果按 指令顺序重新排列。采用乱序执行技术的目的是为了使CPU内部电 路满负荷运转并相应提高了CPU的运行程序的速度。分枝技术: (branch)指令进行运算时需要等待结果,一般无条件分枝只需要 按指令顺序执行,而条件分枝必须根据处理后的结果,再决定是否 按原先顺序进行。
是当cache hit不可预测的时候),并且没有有效地利用带宽。典 型的这类应用程序就是业务处理软件,即使拥有如乱序执行(out of order execution)这样的CPU特性,也会受内存延迟的限制。 这样CPU必须得等到运算所需数据被除数装载完成才能执行指令( 无论这些数据来自CPU cache还是主内存系统)。当前低段系统的 内存延迟大约是120-150ns,而CPU速度则达到了3GHz以上,一次 单独的内存请求可能会浪费200-300次CPU循环。即使在缓存命中 率(cache hit rate)达到99%的情况下,CPU也可能会花50%的 时间来等待内存请求的结束- 比如因为内存延迟的缘故。
支持双通道DDR内存控制器的延迟相比来说,是要低很多的。英特 尔也按照计划的那样在处理器内部整合内存控制器,这样导致北桥 芯片将变得不那么重要。但改变了处理器访问主存的方式,有助于 提高带宽、降低内存延时和提升处理器性能。 |
|