`
kongweile
  • 浏览: 507082 次
  • 性别: Icon_minigender_1
  • 来自: 广州
社区版块
存档分类
最新评论

流水线、超流水线、超标量技术对比

 
阅读更多

http://blog.csdn.net/do2jiang/article/details/4545889

流水线

     流水线技术是一种将每条指令分解为多步,并让各步操作重叠,从而实现几条指令并行处理的技术。程序中的指令仍是一条条顺序执行,但可以预先取若干条指令,并在当前指令尚未执行完时,提前启动后续指令的另一些操作步骤。这样显然可加速一段程序的运行过程。 
市场上推出的各种不同的1 6/ 3 2位微处理器基本上都采用了流水线技术。如8 0 4 8 6P e n t i u m均使用了6步流水线结构,流水线的6步为: 
( 1 ) 
取指令。C P U从高速缓存或内存中取一条指令。 
( 2 ) 
指令译码。分析指令性质。 
( 3 ) 
地址生成。很多指令要访问存储器中的操作数,操作数的地址也许在指令字中,也许要经过某些运算得到。 
( 4 ) 
取操作数。当指令需要操作数时,就需再访问存储器,对操作数寻址并读出。 
( 5 ) 
执行指令。由A L U执行指令规定的操作。 
( 6 ) 
存储或"写回"结果。最后运算结果存放至某一内存单元或写回累加器A 
       
在理想情况下,每步需要一个时钟周期。当流水线完全装满时,每个时钟周期平均有一条指令从流水线上执行完毕,输出结果,就像轿车从组装线上开出来一样。P e n t i u mPentium ProPentium II处理器的超标量设计更是分别结合了两条和三条独立的指令流水线,每条流水线平均在一个时钟周期内执行一条指令,所以它们平均一个时钟周期分别可执行2条和3条指令。 
     
流水线技术是通过增加计算机硬件来实现的。例如要能预取指令,就需要增加取指令的硬件电路,并把取来的指令存放到指令队列缓存器中,使M P U能同时进行取指令和分析、执行指令的操作。因此,在1 6/3 2位微处理器中一般含有两个算术逻辑单元A L U,一个主A L U用于执行指令,另一个A L U专用于地址生成,这样才可使地址计算与其它操作重叠进行。

 

超流水线

      超级流水线以增加流水线级数的方法来缩短机器周期,相同的时间内超级流水线执行了更多的机器指令。采用简单指令以加快执行速度是所有流水线的共同特点,但超级流水线配置了多个功能部件和指令译码电路,采用多条流水线并行处理,还有多个寄存器端口和总线,可以同时执行多个操作,因此比普通流水线执行的更快,在一个机器周期内可以流出多条指令。

 

      一般而言,CPU执行一条指令需要经过以下阶段:取指->译码->地址生成->取操作数->执行->写回,每个阶段都要消耗一个时钟周期,同时每个阶段的计算结果在周期结束以前都要发送到阶段之间的锁存器上,以供下一个阶段使用。所以,每个时钟周期所消耗的时间就是由以上几个阶段中的耗时最长的那个决定的。假设耗时最长的阶段耗时为s秒,那么时钟频率就只能设计到1/s赫兹(这里不考虑阶段间信号传递的时间和锁存器的反应时间)。

      那么,要提高时钟频率,一种可能的方法就是减小每个阶段的时间消耗。其中一种最简单的办法,就是将每个阶段再进行细分成更小的步骤,同样是细分后的每个阶 段,单个阶段的运算量小了,单位耗时s也就减少,这样实际上就是提高了时钟频率。这种将标准流水线细分的技术,就是超级流水线技术。当然,流水线和超级流 水线之间并没有很明显的区别。这样的技术,虽然提高了CPU的主频,但是也带来了很大的副作用:

      首先,细分后的每一个阶段都要在其后使用锁存器锁存,因此将一个阶段细分为N的子阶段并不能让单位时间减少到s/N, 而是s/N + d, 其中d为锁存器的反应时间。这实际上就是增加了多余的时间消耗。

      其次,随着流水线级数的加深,一旦分支预测出现错误,会导致CPU中大量的指令作废,这样的消耗是十分巨大的。

      以上原因,也就是什么Pentium IV具有31级的流水线,指令的执行效率却赶不上只有14级流水线的Pentium M

 

超标量
  超标量(superscalar)是指在CPU中有一条以上的流水线,并且每时钟周期内可以完成一条以上的指令,这种设计就叫超标量技术。 其实质是以空间换取时间。而超流水线是通过细化流水、提高主频,使得在一个机器周期内完成一个甚至多个操作,其实质是以时间换取空间。

分享到:
评论

相关推荐

    超标量流水线.pdf

    超标量流水线;超标量流水线

    现代处理器设计 超标量处理器基础 PDF

    《超标量处理器设计》以超标量处理器的流水线为主线展开内容介绍。《超标量处理器设计》主要内容包括超标量处理器的背景知识、流水线、顺序执行和乱序执行两种方式的特点;Cache的一般性原理、提高Cache性能的方法...

    流水线相关知识ppt

    超标量流水线.pptx 控制冒险的处理.pptx 流水线的“冒险”.pptx 流水线的基本原理.pptx 流水线的优化.pptx 数据冒险.pptx

    现代处理器设计:超标量处理器基础(英文版2007新版+阅读器)

    (2)流水线技术;(3)主存与I/0系统;(4)超标量组织与技术;(5)PowerPC 620和Inltel P6等示例;(6)超标量处理器设计;(7)先进的指令流技术、存储器数据流技术;(8)多线程技术等。 本书适合作为计算机及相关专业的...

    超标量和超长指令字处理器处理器简介

    两课时的流水线处理器,超标量处理器,VLIW微结构介绍

    DSP体系架构 处理器的基本概念和流水线基本结构

    DSP体系架构 处理器的基本概念(单片机、RISC、超流水线、超标量、超标量超流水线、VLIW)和流水线基本结构(三种指令格式 、流水线 、流水线中的相关 )

    论文研究-静态超标量MCU-DSP内核的Load先行访存调度.pdf

    该内核使用静态超标量技术, 拥有整数、存取、循环三条流水线, 并采用特殊的四级流水。在存取流水线中, Load先行机制通过动态调度指令的访存顺序, 实现了Load指令对Store指令的先行, 提前了整数流水线中运算操作数的...

    超标量处理器的指令乱序提交机制综述

    通过设计容量可配置的多缓存指令提交结构,实现存储器操作指令和ALU类型指令的分类退休,根据超标量处理器架构及性能需求对目标缓存和存储缓存容量进行参数化配置降低流水线阻塞风险,同时利用指令目的寄存器编码...

    计算机体系结构试题及答案

    超标量技术 4.4.2 多指令流出的动态调度 4.4.3 超长指令字技术 4.4.4 多流出处理器受到的限制 4.5 小结习题四第五章 存储层次 5.1 存储器的层次结构 5.1.1 从单级存储器到多级存储器 5.1.2 存储...

    13计算机系统结构复习

    超标量处理机和超流水线处理机都可以在一个时钟周期中发射多条指令。所不同的是,超标量处理机是在一个时钟周期中同时...从流水线的时空图上看,超标量处理机采用的是空间并行性,而超流水线处理机采用的是时间并行性。

    论文研究-超标量DSP的片上调试与实时跟踪支持.pdf

    针对嵌入式系统日益严峻的调试挑战,提出并实现了一种基于32 bit超标量DSP内核的片上调试与实时跟踪架构。该架构通过设计专用的跟踪接口与其他硬件资源,并扩展JTAG端口、存储器保护逻辑与流水线控制逻辑,以较低的...

    论文研究-支持AltiVec技术的多媒体协处理单元的研究.pdf

    以 32 bit龙腾嵌入式处理器为基础 ,研究 AltiVec技术以及超标量技术 ,设计了该处理器中支持 AltiVec技术的多媒体协处理单元。该单元采用五级流水线 ,将指令动态调度技术分配到不同的流水线中 ,在提高处理性能的同时...

    L5_CA第五章流水线和向量处理机5_4_5_5PDF1

    1. 超标量处理机基本结构 1. 超标量处理机基本结构 1. 超标量处理机基本结构 1. 超标量处理机基本结构 1. 超标量处理机基本结构 2. 单发射与多发射

    龙芯2E处理器数据手册

    龙芯2E微处理器是一款实现64位MIPS III指令集的通用RISC处理器。...四发射的超标量结构使得指令流水线中指令和数据相关问题十分突出,龙芯 2E采用乱序执行技术和激进的存储系统设计来提高流水线的效率。

    Flute:RISC-V CPU,简单的5级有序流水线,适用于需要MMU和某些性能的低端应用程序

    :使用MIT的RISCY-OOO内核的超标量,深度,乱序管道。 这三个存储库结构几乎相同,并且构建和运行的方式相同。 此自述文件是相同的-请在下面的替换“ Piccolo”,“ Flute”或“ Toooba”。 关于源代码(在BSV和...

    龙芯2E处理器用户手册

    龙芯2E处理器是一款实现64位MIPS III指令集的通用RISC处理器。...四发射的超标量结构使得指令流水线中指令和数据相关问题十分突出,龙芯2E采用 乱序执行技术和激进的存储系统设计来提高流水线的效率。

    计算机组成原理复习题

    异步控制方式、向量地址、多重中断、CMDR、总线判优、系统的并行性、进位链、间接寻址、微操作命令和微操作、快速缓冲存储器、基址寻址、流水线中的多发技术、指令字长、周期窃取、双重分组跳跃进位、硬件向量法、...

    计算机组成原理与设计:从基础到高级的系统实现

    包括数据表示、指令系统、存储器、运算器、控制器、总线、输入输出、中断、流水线、并行处理、存储器层次结构、高速缓存、虚拟存储器、指令集架构、微程序设计、超标量技术等内容,以及计算机的性能评价和优化方法。...

    龙芯2F处理器用户手册

    龙芯2号系列微处理器实现了带有动态分支预测和非阻塞Cache的超标量四发射乱序执行流水线,龙芯2号系列微处理器还使用浮点数据通路复用技术实现了定点的单指令流多数据流指令;下一代的龙芯3号系列微处理器将实现片内...

Global site tag (gtag.js) - Google Analytics