Board logo

标题: 不可磨灭的记忆 CPU发展史经典回顾 [打印本页]

作者: 风中落叶    时间: 2005-12-17 10:13     标题: 不可磨灭的记忆 CPU发展史经典回顾

今天,我们可以舒适在坐在电脑前看电影、听音乐,通过互联网寻找资料,与远方的朋友进行视频聊天,又或者通过电子商务网站购买一本杂志、一款自己心仪的MP3播放器,一切都显得那么随意和悠然自得 。但是大部分人却都没想过,能够有如此幸福生活,是多少人前赴后继,作出了可歌可泣贡献才得到的。
  昨天晚上,一IT界著名的朋友跟笔者说“你每天都喝水,那你有没考虑过水厂和水龙头的关系怎么样的?”。确实,也许并非每个朋友都对IT和其中发生的事情感兴趣,但是曾经发生的事情和有过的经历,却可以让我们 更加珍惜这来之不易的幸福。了解成功人的历史,更可让我们受益菲浅。

  现在就让笔者带大家去回顾一下,这有趣而又激励人心的辉煌历史。



  关于CPU的基础知识:CPU的常识

  第一篇跟大家介绍的是PC里面的心脏:CPU(Central Processing Unit),被称呼为中心处理器或者Microprocessor微处理器。CPU是计算机的核心,其重要性好比心脏对于人一样。实际上,处理器的作用和大脑更相似,因为它负责处理、运算计算机内部的所有数据,而主板芯片组则更像是心脏,它控制着数据的交换。CPU的种类决定了你使用的操作系统和相应的软件,CPU的速度决定了你的计算机有多强大,当然越快、越新的CPU会花掉你更多的钱。  

  CPU从最初发展至今已经有二十多年的历史了,这期间,按照其处理信息的字长,CPU可以分为:四位微处理器、八位微处理器、十六位微处理器、三十二位微处理器以及六十四位微处理器等等。

  如今,Intel的CPU和其兼容产品统治着微型计算机——PC的大半江山,但是除了Intel或AMD的CPU,还是你可能听说过的其他一些CPU,如HP的PA-RISC,IBM的Power4和Sun的UltraSparc等,只是它们都是精简指令集运算(RISC)处理器,使用Unix的专利操作系统,例如IBM的AIX和Sun的Solaris等。

  虽然设计方式和工作原理的过程有区别,但不同处理器依然有很多相似之处。从外表看来,CPU常常是矩形或正方形的块状物,通过密密麻麻的众多管脚与主板相连。不过,你看到的不过是CPU的外衣——CPU的封装。而内部,CPU的核心是一片大小通常不到1/4英寸的薄薄的硅晶片(其英文名称为die,核心)。在这块小小的硅片上,密布着数以百万计的晶体管,它们好像大脑的神经元,相互配合协调,完成着各种复杂的运算和操作。



                        左边是揭了盖可以看到核心的处理器


  硅能成为生产CPU核心的半导体材料主要是因为其分布的广泛性和价格便宜。此外,硅可以形成品质极佳的大块晶体,通过切割,得到直径8英寸甚至更大而厚度不足1毫米的圆形薄片——晶片(也叫晶圆)。一片晶片可以划分切割成许多小片,每一小片就是一块单独CPU的核心。当然,在切割之前有许多处理过程要做。

  Intel发布的第一颗处理器4004仅仅包含2000个晶体管,而目前最新的Intel Pentium 8400EE处理器包含超过2.3亿万个晶体管,集成度提高了十万倍,这可以说是当今最复杂的集成电路了。与此同时,你会发现单个CPU的核心硅片的大小丝毫没有增大,甚至变得更小了,这就要求不断地改进制造工艺以便能生产出更精细的电路结构。如今,最新的处理器采用的是0.065微米技术制造,也就是常说的0.065微米线宽。


                               840EE+HT(左边)65nm(右)
   Pentium 840EE处理器采用90nm制程的Smithfield核心,每核心1MB二级缓存,800MHZ的FSB,支持EDB防毒和EMT64T,可以搭配64位WinXP,90纳米制程,206平方毫米芯片面积,2.3亿晶体管。Pentium 4 643 (3.2GHz)采用65nm工艺的CedarMill,集成2MB二级缓存,单核心,支持HT、EM64T,VT。

  需要说明的是,线宽是指芯片上的最基本功能单元——门电路的宽度,因为实际上门电路之间连线的宽度同门电路的宽度相同,所以线宽可以描述制造工艺。缩小线宽意味着晶体管可以做得更小、更密集,可以降低芯片功耗,系统更稳定,CPU得以运行在更高的频率下,而且在相同的芯片复杂程度下可使用更小的晶圆,于是成本降低了。

  随着线宽的不断降低,以往芯片内部使用的铝连线的导电性能将不敷使用,AMD在其K7系列开始采用铜连线技术。而现在这一技术已经得到了广泛应用。


  关于CPU的基础知识:CPU的制造过程

切割晶圆
  所谓的“切割晶圆”也就是用机器从单晶硅棒上切割下一片事先确定规格的硅晶片,并将其划分成多个细小的区域,每个区域都将成为一个CPU的内核(Die)。

2.影印(Photolithography)
    在经过热处理得到的硅氧化物层上面涂敷一种光阻(Photoresist)物质,紫外线通过印制着CPU复杂电路结构图样的模板照射硅基片,被紫外线照射的地方光阻物质溶解。

3.蚀刻(Etching)
  用溶剂将被紫外线照射过的光阻物清除,然后再采用化学处理方式,把没有覆盖光阻物质部分的硅氧化物层蚀刻掉。然后把所有光阻物质清除,就得到了有沟槽的硅基片。

4.分层
  为加工新的一层电路,再次生长硅氧化物,然后沉积一层多晶硅,涂敷光阻物质,重复影印、 蚀刻过程,得到含多晶硅和硅氧化物的沟槽结构。

5.离子注入(IonImplantation)
  通过离子轰击,使得暴露的硅基片局部掺杂,从而改变这些区域的导电状态,形成门电路。接下来的步骤就是不断重复以上的过程。一个完整的CPU内核包含大约20层,层间留出窗口,填充金属以保持各层间电路的连接。完成最后的测试工作后,切割硅片成单个CPU核心并进行封装,一个CPU便制造出来了。


  关于CPU的基础知识:CPU的主要性能指标

主频

  即CPU的时钟频率(CPU Clock Speed),这是我们最关心的,我们所说的3.2GHz、2.0GHz等就是指它,一般说来,主频越高,CPU的速度就越快,整机的就越高。不过现在AMD都采用了更加模糊的命名方式,企图让消费者淡化以主频率计算性能的观念。比如Athlon 3000+,它的频率有可能是2.20GHz,也有可能是2.0GHz 。Intel 则采用了Pentium 643这种更易让人眼花缭乱的命名方式,一般人不查参数,很难记得它的意义。

FSB前端总线

  即CPU的外部时钟频率,由电脑主板提供,以前一般是133MHz,目前Intel公司最新的芯片组i925XE芯片组使用1066MHz的FSB。

内部缓存(L1 Cache)

  封闭在CPU芯片内部的高速缓存,用于暂时存储CPU运算时的部分指令和数据,存取速度与CPU主频一致,L1缓存的容量单位一般为KB。L1缓存越大,CPU工作时与存取速度较慢的L2缓存和内存间交换数据的次数越少,相对电脑的运算速度可以提高。

外部缓存(L2 Cache)

  CPU外部的高速缓存,现在处理器的L2 Cache是和CPU运行在相同频率下的(以前P2 P3的二级缓存运行在相当于CPU频率一半下)。


  其它的还有封装技术、接口技术、、制造工艺、指令集等就不再详细解释,不然就是写书而不是写文章了。不如如果这系列文章可以持续写下去的话,以后便好好跟大家再交流一下。远去的历史:微处理器发展的第一阶段

  讲完了一些技术的简单内容,现在就带大家去看看CPU是怎样从无到有,并且一步步发展起来的。 根据大家的记忆,笔者把它分为了几个发展阶段。注意,这并非按照教科书去分,而是我们的记忆。




Intel公司成立于1968年,格鲁夫(左)、诺依斯(中)和摩尔(右)是微电子业界的梦幻组合




  Intel 4004
  1971年1月,Intel公司的霍夫(Marcian E.Hoff)研制成功世界上第一枚4位微处理器芯片Intel 4004,标志着第一代微处理器问世,微处理器和微机时代从此开始。因发明微处理器,霍夫被英国《经济学家》杂志列为“二战以来最有影响力的7位科学家”之一。
  4004当时只有2300个晶体管,是个四位系统,时钟频率在108KHz,每秒执行6万条指令(0.06 MIPs)。功能比较弱,且计算速度较慢,只能用在Busicom计算器上。


格鲁夫 “只有偏执狂才能生存”

  1971年11月,Intel推出MCS-4微型计算机系统(包括4001 ROM芯片、4002 RAM芯片、4003移位寄存器芯片和4004微处理器),其中4004(上图)包含2300个晶体管,尺寸规格为3mm×4mm,计算性能远远超过当年的ENIAC,最初售价为200美元。


Intel 8008

  1972年4月,霍夫等人开发出第一个8位微处理器Intel 8008。由于8008采用的是P沟道MOS微处理器,因此仍属第一代微处理器。


  Intel 8080 ,第二代微处理器

  1973年8月,霍夫等人研制出8位微处理器Intel 8080,以N沟道MOS电路取代了P沟道,第二代微处理器就此诞生。主频2MHz的8080芯片运算速度比8008快10倍,可存取64KB存储器,使用了基于6微米技术的6000个晶体管,处理速度为0.64MIPS。


  摩尔定律

  摩尔预言,晶体管的密度每过18个月就会翻一番,这就是著名的摩尔定律。

  第一台微型计算机:Altair 8800

  1975年4月,MITS发布第一个通用型Altair 8800,售价375美元,带有1KB存储器。这是世界上第一台微型计算机。

  1976年,Intel 发布8085处理器



  当时,Zilog、Motorola和Intel在微处理器领域三足鼎立。Zilog公司于1976年对8080进行扩展,开发 出Z80微处理器,广泛用于微型计算机和工业自动控制设备。直到今天,Z80仍然是8位处理器的巅峰之作,还在各种场合大卖特卖。CP/M就是面向其开发的操作系统。许多著名的软件如:WORDSTAR 和DBASE II都基于此款处理器。


  
WordStar
  处理程序WordStar是当时很受欢迎的应用软件,后来也广泛用于DOS平台。

曾经的辉煌代表产品:






Apple Ⅰ
  1976年3月,Steve Wozniak和Steve Jobs开发出微型计算机Apple I,4月1日愚人节这天,两个Steve成立了Apple计算机公司。


Apple II

  1976年:一些离开了Motorola公司的部分工程人员自组成立MOS Technology公司,并且开发出了6502处理器。它的位宽为8bit,频率只有1MHz,并且无协处理器。但它是IBM PC机问世之前世界上最流行的微型计算机Apple II(苹果机)的CPU。Apple II是第一个带有彩色图形的个人计算机,售价为1300美元。Apple II及其系列改进机型风靡一时,这使Apple成为微型机时代最成功的计算机公司。


Intel 8086
  1978年6月,Intel推出4.77MHz的8086微处理器,标志着第三代微处理器问世。它采用16位寄存器、16位数据总线和29000个3微米技术的晶体管,售价360美元。 不过当时由于360美元过于昂贵,大部分人都没有足够的钱购买使用此芯片的电脑,于是 Intel 在1年之后,推出4.77MHz的8位微处理器8088。IBM公司1981年生产的第一台电脑就是使用的这种芯片。这也标志着x86架构和IBM PC 兼容电脑的产生。      
  发布的时候,8086的时钟频率有4.77,8和10MHz 三个版本,包括了具有300个操作的指令集。其中8MHz 版本包含了大约28,000个 晶体管,具备0.8 MIPs 的能力。


当Bill Gates崭露头角时,昔日校友正在哈佛上二年级



“让每个家庭每张桌子上都放一台电脑。”

  1979年6月1日,Intel推出4.77MHz的准16位微处理器8088,它是8086的廉价版本,价格为大众所接受。在性能方面,它在内部以16位运行,但支持8位数据总线,采用现有的8位设备控制芯片,包含29000个3微米技术的晶体管,可访问1MB内存地址,速度为0.33MIPS。

Intel 8088电路
  同年9月,Motorola推出M68000 16位微处理器,它因采用了68000个晶体管而得名。该处理器主要供应Apple公司的Macintosh 和Atari 的ST系列电脑上。后继版本的处理器,包括68020则被使用在Macintosh II 机型。


Microsoft的秘密交易
  1980年10月,Microsoft把握了一次绝佳的发展机遇。IBM在秘密进行代号为“跳棋计划”的开发项目(第一台IBM PC)过程中,向Microsoft提出采购一套操作系统。Paul Allen抓住机会与Seattle Computer Products的Tim Patterson签约,向其支付了不到10万美元,获得了其DOS操作系统的版权并进行了一些修改,从而做成了与这个神秘客户(IBM)的大买卖。
    今天的Windows系列操作系统仍然兼容DOS,这个系统对于老一代电脑用户来说再熟悉不过了。


IBM PC创造历史
  早在1980年7月,一个负责“跳棋计划”的13人小组秘密来到佛罗里达州波克罗顿镇的IBM研究发展中心,开始开发后来被称为IBM PC的产品。一年后的8月12日,IBM公司在纽约宣布第一台IBM PC诞生,这个开创计算机历史新篇章的时刻,迄今正好25年。
  第一台IBM PC采用了主频为4.77MHz的Intel 8088,操作系统是Microsoft提供的MS-DOS。IBM将其命名为“个人电脑(Personal Computer)”,不久“个人电脑”的缩写“PC”成为所有个人电脑的代名词。IBM原来预计在一年中售出241683台PC,然而用户的需求被大大低估了,实际上一个月的订货量就超出了预计。 


  
1981年:80186和80188发布。这两款微处理器内部均以16位工作,在外部输入输出上80186采用16位,而80188和8088一样均是采用8位工作。这是一颗性能介于8088,80286之间的的CPU。但事实上80186从来都没有在PC中应用,它仅仅存在于一个小范围的圈子中,作为一个小型的控制器出现,哪怕是今天。从这个时候起,AMD公司已经开始生产80186 CPU了。

  1982年2月1日:在80186发布后的几周,80286就发布了。80286处理器集成了大约13.4万个晶体管,最大主频为20MHz,采用16位资料总线和24位位址总线。与8086相比,80186/80188增强了部分软硬件功能 80286增加了实存(24位地址)和虚拟存储器管理,可以在两种不同的模式下工作,一种叫实模式,另一种叫保护方式。80286开始正式采用一种被称为PGA的正方形包装。


Intel 80386
  1985年10月,Intel推出16MHz 80386DX微处理器(最高33MHz 主频),可以直接访问4G字节的内存,并具有异常处理机制;虚拟86模式可以同时模拟多个8086处理器来加强多任务处理能力。 80386的广泛应用,将PC机从16位时代带入了32位时代。此外它还具有比80286更多的指令集。发布时,80386的最快速版本的主频为20MHz,具备6.0 MIPs ,包含275,000个晶体管。
  当时,IBM已经收到大量286机器的订单,不愿立即转向386,同时IBM担心长期受制于Intel芯片,开始暗中开发自己的处理器,所以对是否采用386芯片不置可否。Compaq乘机而上,推出386芯片的电脑,迅速占领了市场。
  1988年6月16日:80386SX 发布,它是80386DX的廉价版本,只有16-bit总线宽度。


希的记忆:我们曾有过第一次亲密接触
  前面的处理器我们都积少接触,接下来的,也许大家就比较清楚了,因为我们第一次接触的,就是此类处理器。

Intel 486
  CPU更新速度加快,造就了越来越多的兼容机厂商。
  1989年4月,Intel推出25MHz 486微处理器。1989年5月10日:我们大家耳熟能详的80486芯片由英特尔推出。这款经过四年开发和3亿美 元资金投入的芯片的伟大之处在于它首次实破了100万个晶体管的界限,集成了120万个 晶体管,使用1微米的制造工艺。其实486就是80386+80387协处理器+8KB一级缓存,是超级版本的386。
  Compaq由于持有大量386订单而对采用Intel 486犹豫不决,Dell趁机推出了自己的486整机,并通过直销模式在兼容机市场后来居上。1991年,25岁的Michael Dell成为《财富》全美500家大企业中最年轻的总裁。1995年,Dell进入全球个人电脑5强行列。
  1991年5月22日:80486 DX 的廉价版本80486 SX 发布,它和DX的区别是没有整合FPU。

Pentium浮出水面
  1993年3月22日:全面超越486的新一代586 CPU问世,为了摆脱486时代微处理器名称混乱的困扰,英特尔公司把自己的新一代产品命名为Pentium(奔腾)以区别AMD和Cyrix的产品。AMD和Cyrix也分别推出了K5和6x86微处理器来对付芯片巨人,但是由于奔腾微处理器的性能最佳,英特尔逐渐占据了大部分市场。Pentum 处理器的性能接近主要的RISC CPU并兼容80x86,同时继承了长期积累下来的价值约500亿美元的庞大软件资源。

  Pentium最初级的CPU是Pentium 60和Pentium 66,分别工作在与系统总线频率相同的60MHz和66MHz两种频率下,没有我们现在所说的倍频设置。
1994年3月7日:Intel 发布90和100MHz 的Pentium 处理器
1994年10月10日:Intel 发布75MHz 版本的Pentium 处理器
1995年3月27日:Intel 发布120MHz 的Pentium 处理器
1995年6月1日:Intel 发布133MHz 版本Pentium 处理器


Pentium Pro

  Intel推出Pentium Pro微处理器,采用了一种新的总线接口Socket 8。新的处理器对多媒体功能提供了很好的支持。
  1995年11月1日,Intel推出了Pentium Pro处理器。Pentium Pro的工作频率有150/166/180和200MHz四种,都具有16KB的一级缓存和256KB的二级缓存。它是基于Pentium 完全相同的指令集和兼容性,达到了440 MIPs 的处理能力和5.5 M个晶体管。这几乎相当于比4004处理器的晶体管提升了2400倍。值得一提的是Pentium Pro采用了“PPGA” 封装技术。即一个256KB的二级缓存芯片与Pentium Pro芯片封装在一起 ,两个芯片之间用高频宽的内部总线互连,处理器与高速缓存的连接线路也被安置在该封装中,这样就使高速缓存能更容易地运行在更高的频率上。
  例如Pentium Pro 200MHz CPU的L2 Cache就是运行在200MHz,也就是工作在与处理器相同的频率上,这在当时可以算得上是CPU技术的一个创新。Pentium Pro的推出,为以后Intel推出PⅡ奠定了基础。
1996年1月4日:Intel 发布150&166 MHz Pentium 处理器,包括了越3.3M 个晶体管
1996年10月6日: Intel 发布200MHz Pentium 处理器

Intel Pentium MMX 
  1997年1月8日:Intel在1996年推出的Pentium 系列的改进版本,内部代号P55C,也就是我们平常所说的Pentium MMX 。Pentium MMX在原Pentium的基础上进行了重大的改进,增加了片内16KB数据缓存和16KB指令缓存,4路写缓存以及从Pentium Pro、Cyrix而来的分支预测单元和返回堆栈技术,特别是新增加的57条MMX多媒体指令。
  MMX技术是Intel最新发明的一项多媒体增强指令集技术,它的英文全称可以翻译成“多媒体扩展指令集”。使得Pentium MMX即使在运行非MMX优化的程序时也比同主频的Pentium CPU要快的多。57条MMX指令专门用来处理音频、视频等数据,这些指令可以大大缩短CPU在处理多媒体数据时的等待时间,使CPU拥有更强大的数据处理能力。MMX CPU比普通CPU在运行含有MMX指令的程序时,处理多媒体的能力提高了60%左右。MMX技术开创了CPU开发的新纪元。
  Pentium MMX系列的频率只有三种:166MHz、200MHz、233MHz,一级缓存从Pentium的16KB增加到了32KB,核心电压2.8v,倍频分别为2.5、3、3.5。插槽都是Socket 7。

  与此同时,作为Intel的主要竞争对手,AMD也发布了AMD-K6-MMX 处理器,包含相近的指令集,从而导致了一连串的法律纠纷。


  1997年4月7日 。英特尔发布了Pentium II处理器。内部集成了750万个晶体管,并整合了MMX指令集技术。此时,英特尔 Pentium II架构已经从Socket 7转成Slot 1,并首次引入了S.E.C封装(Single Edge Contact)技术,将高速缓存与处理器整合在一块PCB板上。Slot 1的Pentium II晶体管数为900万,并且具有两种版本的核心:Klamath与Deschutes。

同时代竞争的是AMD的K6II,这时候的口碑也相当不错
1997年6月2日: Intel发布233MHz Pentium MMX
1998年2月:Intel 发布333MHz Pentium II 处理器,开发代号为Deschutes,并且首次采用了0.25微米制造工艺,在低发热量的情况下提供比以前产品更快的速度。

1999年2月22日:AMD 发布K6-III 400MHz 版本,在一些测试中,它的性能超越了后来发布的Intel Pentium III 。它包括了23M 晶体管,并且基于100MHz Spuer socket7 主板,与那些使用66MHz 总线的芯片相比,性能的提升是卓越的。


一起走过的日子:淘汰的记忆
  以下部分处理器是我们曾经用过的,最后却远远地抛进了淘汰的行列,对于有两台甚至多台电脑的朋友来说,印象尤其深刻。因为电脑和电视不同,它的特点是需要我们不断地更新、升级。
  当然,目前仍有部分用户还在使用这些产品。


Intel向网络看齐 ,发布Pentium III 
  1999年1月,Intel推出奔腾III处理器,它采用0.25微米制造工艺,拥有32K一级缓存和512K二级缓存(运行在芯片核心速度的一半下),包含MMX指令和Intel自己的“ 3D”指令SSE,最初发行的PIII有450和500MHz两种规格,其系统总线频率为100MHz。此外其身份代码还可通过Internet读取。

  Intel的主要对手之一AMD加紧跟进的步伐,于同年8月发布Athlon处理器。10月,在微处理器论坛会议上,Intel宣布了代号为麦赛德(Merced)的处理器的正式名称Itanium(安腾)。
  1999年10月,Intel推出了基于0.18微米工艺制造的Pentium III处理器,这款Pentium III处理器有256K在二级高速缓存,代码名为Coppermine。Coppermine以733MHz登台。随着工艺尺寸从0.25微米减少到0.18微米,不仅提高了Pentium III处理器的时钟速度,也使的Intel在技术上能够推出了集成的二级高速缓存。虽然集成的二级高速缓存只有老式Pentium III处理器的一半,但在处理器全速下运行,性能仍有显著提高。
  其后Intel推出了Pentium III Xeon处理器。作为Pentium II Xeon的后继者,除了在内核架构上采纳全新设计以外,也继承了Pentium III处理器新增的70条指令集,以更好执行多媒体、流媒体应用软件。除了面对企业级的市场以外,Pentium III Xeon加强了电子商务应用与高阶商务计算的能力。Intel还将Xeon分为两个部分,低端Xeon和高端Xeon。其中,低端Xeon和普通的Coppermine一样,仅装备256KB二级缓存,并且不支持多处理器。这样低端Xeon和普通的Pentium III的性能差距很小,价格也相差不多;而高端Xeon还是具有以前的特征,支持更大的缓存和多处理器。
1999年11月29日:AMD 发布了Athlon 750MHz ,在主频和性能上超过Intel 。
2000年3月6日 : AMD 发布Athlon 1GHz
2000年3月8日: Intel 限量供应1GHz Pentium III 处理器
  Intel和AMD炽手可热的花旦
  接下来为大家介绍的就是目前炽手可热的处理器,Intel 的Pentium IV 和AMD Athlon64 。虽然按照发布时间来说,Athlon64 要比Pentium IV 迟一个时代(Pentium IV 发布时间是2000年11月,而Athlon64 则是2003年9月),但Pentium IV 经过了几年的的换芯,性能也获得了显著提升。
  此外在Intel和AMD 的发展版图上来说,它们是竞争对手,而且现在都加入了64-bit和双核等等技术特性,以下对它们进行比较详细的解释。   
  1、Pentimu 4技术解释
  2000年11月21日,Intel 在全球同步发布了其最新一代的微处理器—Pentium4(奔腾4)。Pentium4处理器原始代号为 Willamette,采用0.18微米铝导线工艺,配合低温半导体介质(Low-Kdiclcctric)技术制成,是一颗具有超级深层次管线化架构的处理器。
  Pentium 4处理器最主要的特点就是抛弃了Intel沿用了多年的P6结构,采用了新的 NetBurst CPU结构 。NetBurst结构具有不少明显的优点:20段的超级流水线、高效的乱序执行功能、2倍速的ALU、新型的片上缓存、SSE2指令扩展集和400MHz的前端总线等等

新的处理器系统总线( FSB)
  英特尔近来在前端系统总线(FSB)方面一直不敌AMD:Pentium Ⅲ最高为133MHz的FSB和内存频率(外频);而AMD雷鸟用的 是100MHz的内存频率(外频)和266MHz的FSB(类似于CPU倍频的方式来连接这两个频率)。
  Pentium 4终于有了突破:虽然 Pentium 4 系统总线仅为 100Mhz,并且也是 64位数据宽度,但由于利用与 APG4X 相同的原理“四倍泵速”,因此可传输高达 8 位 * 100 百万次/秒 * 4 = 3,200 MB/秒 的数据传输速度。明显地远超过 AMD 最近公布的Athlon 总线数据传输速度。 Athlon 总线速度为133Mhz,64位、2倍速,提供 8 位 * 133 百万次/秒 * 2 = 2,133 MB/秒的数据传输率。
  这项特色使得 Pentium 4 传输数据到系统的其它部分比目前所有的 x86 处理器还快,也一并去除了 Pentium III 系统所遭受的瓶颈限制。 不过,如果主存储器无法提供相对数据传输的话,这么快的处理器总线速度也是英雄无用武之地。因此,早期此处理器的芯片组 850 就搭配了两条Rambus 信道并使用昂贵的 RDRAM 内存。这两个 RDRAM 信道能提供与 Pentium 4 系统总线(3,200MB/s)相同的数据频宽,这样的搭配将是理论上最完美的结合─提供处理器、系统与主存储器间最高的数据传输率,这也是最明显的优势之一。不过系统的整体系统的成本将会因为使用较昂贵的 RDRAM 而提高。
高速执行缓存
  为了增加8KB的数据缓存,P4包含了一个执行跟踪缓存,可存储12K的微指令以帮助程序执行。这些指令不在主程序循环中执行,不被存储,从而大大提高了系统性能。
快速执行引 擎
  算术逻辑单元(ALU)以双倍的时钟速度运行,这让类似于加、减、逻辑与、逻辑或等基本运算的执行只用了1/2时钟。例如,1.5GHz的快速执行引擎其实是以3GHz在运算。
高级动态执行
  高级动态执行是控制CPU执行顺序的动态单元。P4可以发出126条动态指令,使流水线完成48次载入和24次存储。与前一代的PⅢ处理器相比,它能够增加33%的预处理速度,还可以在缓存中存储更多的历史信息从而快速取出。
改进的浮点数运算和多媒体单元
  P4的128位运算动态增加了运算单元,使得浮点数运算和多媒体表现都得到了较大的改进。
网络数据流单指令多数据扩展2(SSE2)
  通过增加的144条新指令,SSE2具有更强多媒体增强指令和数据流单指令。这些特性包括一个128位单指令多数据整数运算和128位单指令多数据双精度浮点指令,这些指令减少了原有的指令执行数量,大大增加了执行速度。使得用户的视频、音频、图象处理、加密、财政、工程和科学应用都极大增强。SSE2可以提高多媒体的执行效率,特别是DVD/MP3/MPEG4的回放,可以最大效果地体现P4新指令集的威力。
  总结:在理论上,Pentium IV是完美无缺,可是实际状况却远非Intel想象的那么简单。第一代Pentium IV 可以说是Intel 近几年内的最大失败。
  首先是P4耗电惊人,所以P4系统使用的主板被设计为电源的12V电压(ATX12),通过一个4脚的插座和3.3V、5V一起供给主板,另外还在20针电源接口的旁边另加了一个6针的辅助电源接口。
  最致命的硬伤还是Willamette核心属于Pentium 4最早期的产品,因此它的发热量很大、频率提升困难,只有1.7GHz和1.8GHz两个版本。而且它的二级缓存只有256KB,超深的处理流水线使得总体性能并不理想,特别是对于超频用户来说,这类产品难以让人感到满意 。
  因此Intel很快就开发出了Northwood核心的产品,以满足消费者的需求。Northwood核心的Pentium 4采用0.13微米工艺制造,相比Willamette内核的处理器,其主频有了很大飞跃,二级缓存也从256K翻番到512KB。而Prescott核心的Pentium 4采用了另人咋舌的31级流水线设计,配备16KB的一级数据缓存和多达1MB的二级缓存。
  接着是双核心的Intel Pentium 840EE 发布,此时Intel Pentium IV 核心已经发展到了颠峰。
  2、Athlon64 技术解释

  2003年美国时间 9 月 23 日,全球第一款桌面系统 64bit 处理器在美国正式发布。几经波折, Athlon 64 终于在人们期待的目光中揭开了神秘面纱。Athlon 64 的诞生对于桌面处理器领域具有划时代的意义。对于 AMD 来说,这更是具有战略意义的关键一步。AMD——终于打破了最近时期的不利局面——按照原定布局领先对手步入了 64bit 时代。跳开对手在架构和制造工艺等方面的追击,另辟战场利用 Athlon 64 再度出击。
  Athlon64 的发布,使得桌面电脑可以迅速迈入64-bit 时代,目前操作系统、软件都已经逐渐成熟。AMD 正在迎来丰收时期。 
  发布之初,Athlon64的产品线划分非常明确,一为采用Socket940接口,面向顶级桌面用户的Athlon64 FX系列;另一个就是面向主流用户,采用Socket754接口的Athlon64系列。但是,随着时间的推移和竞争对手的不断变化,Athlon64处理器家族也渐渐庞大了起来。到如今,Athlon64家族已经演变成为了一个拥有4种核心、3种接口、2种制程、近20款产品的复杂体系。   
  它的主要技术特点如下:
64位计算能力
  这是Athlon64与传统32位处理器的最大区别所在。在Athlon64和Athlon64 FX处理器中,AMD加入了一个被称为x86-64的指令集,正是这个指令集赋予了Athlon64系列处理器64位的计算能力。同时,AMD清醒地认识到,64位应用目前还远未成为主流,所以,它并没有将Athlon64/FX设计成一款仅支持64位计算的处理器,而是在支持64位代码的基础上提供了对32位和16位代码的良好兼容。正是这样的设计使得Athlon64/FX在执行32位代码时不必重新进行编译,从而避免了效率低下所导致的性能损失。总体来说,Athlon64/FX既为我们提供了64位计算能力,又完全兼容目前的32位甚至16位应用,是一款全能型处理器。
  2.超过4GB的内存寻址能力
  除了64位计算能力,x86-64指令集还使Athlon64系列处理器拥有了64位的地址空间和64位的数据空间,换句话说就是x86-64指令集使Athlon64/FX可以支持4GB以上的内存(64位处理器理论上支持2的64次方寻址空间,可支持上亿GB的内存),而传统的32位处理器最高仅支持4GB内存。更大容量的内存支持能力使Athlon64/FX在诸如大型数据库、CAD/CAM建模以及对系统要求越来越BT的3D游戏等高端应用中有着不可比拟的优势。
  3.处理器内部集成内存控制器
  这也是Athlon64系列的独门绝技之一。与传统的处理器把内存控制器放在芯片组相比,处理器把内存控制器内置可以极大地降低数据收发延迟、缩短读写请求的反应时间,处理器的性能将因此获得可观的提升。除此之外,处理器内部集成内存控制器还可以简化北桥芯片的结构,目前,一些芯片组厂商已经成功设计出了单芯片的Athlon64主板产品。
  4.HyperTransport总线
  在Athlon64处理器架构中,HyperTransport总线负责的是处理器与北桥芯片间的数据传输,它的带宽直接影响了系统的整体性能。目前,Athlon64的HyperTransport总线共有两种频率:800MHz和1GHz,它们均采用了与DDR内存相同的Dual Pump技术,在一个时钟周期内可以传输两次数据,其上下行位宽为相同的16bit,所以,800MHz HyperTransport总线的数据带宽为6.4GB/s,而1GHz HyperTransport总线的数据带宽则达到了惊人的8GB/s。
  5.Execution Protection防病毒技术
  Execution Protection技术是AMD公司应用在Athlon64中的又一项新技术,这项技术可以防止病毒的缓冲区溢出攻击(指病毒使CPU因缓冲区溢出而执行恶意代码的攻击技术)。应用这项技术后,CPU缓冲区的数据将会只读而不能执行,可以有效地防止恶意代码的执行。目前,这项技术已经被封装在了Athlon64系列CPU中,不过还需要Windows XP Service Pack 2的支持方能发挥作用。
  总结:64-bit、双核和其它
  算一下微处理器的发展史也不过30余年,但在这30余年里微处理器的发展历程却是天翻地覆的变化。从Intel的4004开始,到了Intel,AMD,Cyrix三足鼎立,到Intel一家独大,再到现在Intel,AMD分庭抗衡。时代的进步,科技的发展。30余年,给人带来的回忆是太多太多。
  CPU将向速度更快、64位结构、多核心方向前进。CPU的制作工艺将更加精细,将会由现在0.09微米向0.065微米过渡。到2007年时,大部分CPU厂商都将采用0.065微米工艺制造处理器。制造工艺的提高,味着体积更小,集成度更高,耗电更少。
  在另一方面,由于CPU的性能已经足够满足个人大多数应用的需要,所以人们在买PC的时候,CPU已经不再是唯一的标准。高速3D处理能力、HDTV视频、高保真音频、大容量硬盘已经成为重要标准。
  在未来,APU、GPU都具备相似能力的时候,CPU的作用还有如此重要吗?

[ Last edited by 风中落叶 on 2005-12-17 at 10:17 ]




欢迎光临 工程家园 (http://heubbs.cn/) Powered by Discuz! 7.2