《一种低功耗的寄存器堆的写回丢弃方法.pdf》由会员分享,可在线阅读,更多相关《一种低功耗的寄存器堆的写回丢弃方法.pdf(11页完整版)》请在专利查询网上搜索。
1、(10)申请公布号 CN 103425460 A(43)申请公布日 2013.12.04CN103425460A*CN103425460A*(21)申请号 201310363885.7(22)申请日 2013.08.20G06F 9/38(2006.01)G06F 1/32(2006.01)(71)申请人复旦大学地址 200433 上海市杨浦区邯郸路220号(72)发明人虞志益 俞政 于学球 张家杰曾晓洋(74)专利代理机构上海正旦专利代理有限公司 31200代理人陆飞 盛志范(54) 发明名称一种低功耗的寄存器堆的写回丢弃方法(57) 摘要本发明属于微处理器技术领域,具体涉及一种低功耗的寄存。
2、器堆的写回丢弃方法。本发明以现有微处理器为基础,其步骤包括:对所述微处理器,扩充原有的MIPS指令集,在有冗余位的指令中增加3位的“生命长度”来表征当前寄存器变量将要被几条后续指令使用;在执行级、访存级和对齐级增加“生命长度”调整逻辑,如果当前寄存器变量被后续的指令使用,则将其“生命长度”减小1,一旦发现当前寄存器变量的“生命长度”为0,则将其通过基于选择器-寄存器的屏蔽逻辑丢弃。指令寄存器生命长度静态推测算法由软件工具实现。与现有的架构相比,本发明能够在几乎不增加硬件开销的情况下,有效地发现可以丢弃的寄存器变量,从而降低寄存器堆的功耗和功耗密度。(51)Int.Cl.权利要求书2页 说明书6。
3、页 附图2页(19)中华人民共和国国家知识产权局(12)发明专利申请权利要求书2页 说明书6页 附图2页(10)申请公布号 CN 103425460 ACN 103425460 A1/2页21. 一种低功耗的寄存器堆写回丢弃方法,以现有的基本流水线结构的MIPS微处理器为基础,所述现有的微处理器包含取指令级、译码级、执行级、访存储器级、对齐级和写回级;其特征在于具体步骤为:(1)对所述微处理器,扩充原有的MIPS指令集,在有冗余位的指令中增加3位的“生命长度”来表征当前寄存器变量将要被几条后续指令使用;其中,寄存器X的生命长度定义如下:当寄存器X在执行级(E)、访存级(M)、对齐级(A) 级时。
4、,如果寄存器X有1、2、3个在其反馈范围内的后续指令需要用到寄存器X,则寄存器X的生命长度就对应的被指定为1、2、3;如果寄存器X有超出反馈范围的后续指令需要用到寄存器X,则寄存器X的生命长度就被定义为4 ;(2)在上述扩充MIPS指令集的基础上,在执行级、访存级和对齐级增加“生命长度”调整逻辑:即如果当前寄存器变量被后续的指令使用,则将其“生命长度”减小1;一旦发现当前寄存器变量的“生命长度”为0,则将其通过基于选择器-寄存器的屏蔽逻辑丢弃。2. 根据权利要求1所述的方法,其特征在于,进一步进行指令寄存器生命长度静态推测计算,该计算由软件工具实现,该软件工具静态遍历生成的汇编代码,确定需要加。
5、入“生命长度”的指令中的寄存器变量的“生命长度”,并将其嵌入到当前指令的冗余位;所述的指令寄存器生命长度静态推测计算的算法包括:一个主算法和两个子算法,主算法简称算法I,两个子算法分别是:组内生命周期计算,简称算法II,组外写丢弃判断计算,简称算法III;主算法的步骤如下:(1)针对当前程序的汇编代码中每条指令,首先调用算法II来计算组内的生命周期life和写丢弃信号wd,如果算法II返回了有效的wd信号,表示算法II确定在组内该寄存器可以被丢弃,那么算法I就将该指令寄存器的生命确定为life;如果life等于4,则表明在组内确定该指令的寄存器不能被丢弃,算法I就将life置为4;否则表示单独。
6、调用算法II无法确定是否要丢弃;于是(2)进一步调用算法III,如果算法III确定可以丢弃,则将指令的寄存器生命周期置为算法III的返回值,否则将其置为4;其中,算法II步骤如下:(1)在当前指令的后续选择3条后续指令构成一个组(group),当当前指令在延迟槽时,按照分支发生与不发生,获得两个组;(2)定义三个概念:distance,即距离,表示当前指令的寄存器将隔多少个时钟周期而被后续的指令用到,如果距离大于3,则一律置为4;dependent,即依赖性,表示当前指令是否依赖于第一条指令,依赖意思是当前指令的操作数来自第一条指令的目的寄存器;rewrite,即覆写,表示当前指令的目的寄存器。
7、是否与第一条指令一致,一致则为覆写,否则不为覆写;(3)算法II首先获取当前指令对应的指令组,然后填写步骤(2)中三个概念:distance、dependent、rewrite所对应项的表格,然后开始逐一检查后续指令,A、如果发现有指令依赖于第一条指令,且距离为4,则将第一条指令的生命周期置为4,退出;B、如果有依赖且距离小于4,则生命周期加1;C、如果出现了覆写,则判断生命周期是否是4,如果是的话不能丢弃,否则可以丢弃,返回生命周期;算法III步骤如下:权 利 要 求 书CN 103425460 A2/2页3(1)如果判断出当前指令被后续指令使用,则表示当前指令的寄存器不能被丢弃,返回0,结。
8、束;(2)否则,如果判断出当前指令的寄存器被后续的指令覆写了或者达到程序的结束出口,则开启下一轮的判断;(3)如果下条指令是条件分支指令,那么必须同时判断分支是否发生两条路,这里将分支节点存入到分支容器中,如果在分支容器中发现了这个分支节点,则表示之前已经达到过这个分支点,意味着出现了环,需要把环剔除,否则将分支存入容器,并且先判定分支成功的支路,然后再判断分支失败的支路,直到达到步骤(2)中所说的条件,算法结束。权 利 要 求 书CN 103425460 A1/6页4一种低功耗的寄存器堆的写回丢弃方法技术领域0001 本发明属于微处理器技术领域,具体涉及一种低功耗的寄存器堆的写回丢弃方法。背。
9、景技术0002 寄存器堆是处理器中第一级存储单元,是现代微处理器的核心部件,由于对寄存器堆的访问呈现出高速、高频的特点,是的寄存器堆的功耗和功耗密度都相当大,以至于成为了微处理器的能量消耗主要部件和功耗热点。高能耗对微处理器特别是嵌入式应用领域的微处理器提出了挑战,而功耗热点更会导致电路稳定性和寿命下降。因此,研究降低寄存器堆功耗有十分重要的现实意义。0003 图1展示了传统的6级流水线的微处理器结构图。包括了取指令级、译码级、执行级、访存储器级、对齐级和写回级。0004 在传统的微处理器架构中,对于寄存器堆的写回没有专门的电路进行控制,实际指令执行过程中可能出现无用的写回操作,但这些操作在传。
10、统的微处理器架构中不会被屏蔽,从而导致了不必要的能量消耗,针对这个缺点,需要对寄存器堆的写回进行控制,一旦发现无用的写回操作则将相应的写回操丢弃,从而降低寄存器堆的访问功耗。发明内容0005 本发明的目的在于提供一种能够降低访问功耗的寄存器堆写回丢弃方法。0006 本发明通过在某些指令中插入表征当前指令目的寄存器的生命长度的标签,并在执行级、访存级和对齐级进行生命长度的减小,来判断当前的目的寄存器是否需要写回(如果为0则放弃写回),从而降低寄存器堆无用的写回功耗,同时也降低寄存器堆的功耗密度,提高电路的稳定性和寿命。0007 本发明提供的能够降低访问功耗的寄存器堆写回丢弃方法,以现有的基本流水。
11、线结构的MIPS微处理器为基础,所述现有的微处理器包含取指令级、译码级、执行级、访存储器级、对齐级和写回级(见图1所示);具体步骤为:(1)对该微处理器,扩充原有的MIPS指令集,在有冗余位的指令中增加3位的“生命长度”来表征当前寄存器变量将要被几条后续指令使用;本发明中,寄存器X的生命长度定义如下:当寄存器X在E(执行级), M(访存级), A(对齐级) 级时,如果寄存器X有1、2或3个在其反馈范围内的后续指令需要用到寄存器X,则寄存器X的生命长度就对应被指定为1、2或3;如果寄存器X有超出反馈范围的后续指令需要用到寄存器X,则寄存器X的生命长度就被定义为4。反馈范围定义为:当某条在译码级(。
12、D级)的指令Y用到了寄存器X时,而产生寄存器X的指令Z处在E、M或者A级,则称Y指令在Z指令产生寄存器X的反馈范围内,例如在图2中,当寄存器$1在E、M、A级时表示其在反馈范围内,一旦超过这个范围,比如在最下方的一条指令用到了寄存器$1,则定义为寄存器$1的后续指令超出了反馈范围。说 明 书CN 103425460 A2/6页50008 (2)在上述扩充MIPS指令集的基础上,在执行级、访存级和对齐级增加“生命长度”调整逻辑:即如果当前寄存器变量被后续的指令使用,则将其“生命长度”减小1;一旦发现当前寄存器变量的“生命长度”为0,则将其通过基于选择器-寄存器的屏蔽逻辑丢弃。具体的步骤为:1、如。
13、果当前处在执行级、访存级或对齐级的指令目的寄存器被位于译码级的指令用到,则当前指令中的“生命长度”的tag就被减1;2、如果当前指令中的“生命长度”的tag的值减为0,则传递给下一级的数据将保持不变,而表征寄存器堆写回的信号将被置为无效,从而在最后写回级不会将该寄存器变量写回。值得说明的是,上述步骤在执行级、访存级和对齐级拥有相同的结构。0009 进一步,本发明还提供指令寄存器生命长度静态推测计算的算法,该算法由软件工具实现,该软件工具可以静态遍历生成的汇编代码,确定需要加入“生命长度”的指令中的寄存器变量的“生命长度”,并将其嵌入到当前指令的冗余位。0010 所述的指令寄存器生命长度静态推测。
14、计算的算法包括一个主算法和两个子算法,主算法简称算法I,两个子算法分别是:组内生命周期计算(inGroupLifetimeCalculation),简称算法II,组外写丢弃判断计算(outOfGroupWriteDiscardingJudgement),简称算法III;指令寄存器生命长度静态推测算法的代码见附录。 0011 主算法调用两个子算法,主算法的步骤如下:(1)、针对当前程序的汇编代码中每条指令,首先调用算法II来计算组内的生命周期life和写丢弃信号wd,如果算法II返回了有效的wd信号(表示算法II确定在组内该寄存器可以被丢弃),那么算法I就将该指令寄存器的生命确定为life,如果。
15、life等于4,则表明在组内确定该指令的寄存器不能被丢弃,算法I就将life置为4,否则表示单独调用算法II无法确定是否要丢弃;(2)、进一步调用了算法III,如果算法III确定可以丢弃,则将指令的寄存器生命周期置为算法III的返回值,否则将其置为4。0012 算法II是组内推测,其步骤如下:(1)、在当前指令的后续选择3条后续指令构成一个组(group),当当前指令在延迟槽时,按照分支发生与不发生,可以获得两个组,如附录(II-a)所示;(2)、定义三个概念:distance,即距离,表示当前指令的寄存器将隔多少个时钟周期而被后续的指令用到,如果距离大于3,则一律置为4,dependent,。
16、即依赖性,表示当前指令是否依赖于第一条指令,依赖意思是当前指令的操作数来自第一条指令的目的寄存器,rewrite,即覆写,表示当前指令的目的寄存器是否与第一条指令一致,一致则为覆写,否则不为覆写;如附录(II-b)所示;(3)、算法II首先获取当前指令对应的指令组,然后填写附录(II-b)所示的表格,然后开始逐一检查后续指令,A、如果发现有指令依赖于第一条指令,且距离为4,则将第一条指令的生命周期置为4,退出;B、如果有依赖且距离小于4,则生命周期加1;C、如果出现了覆写,则判断生命周期是否是4,如果是的话不能丢弃,否则可以丢弃,返回生命周期,如附录(II-c)所示。0013 算法III是组外。
17、判断,由于本算法可以遍历整个程序,考虑到程序中可能存在的分支点,引入了一个容器来保存程序中的分支点。算法III的具体步骤为:(1)、如果判断出当前指令被后续指令使用,则表示当前指令的寄存器不能被丢弃,返说 明 书CN 103425460 A3/6页6回0,结束;(2)、否则,如果判断出当前指令的寄存器被后续的指令覆写了或者达到程序的结束出口,则开启下一轮的判断;(3)、如果下条指令是条件分支指令,那么必须同时判断分支是否发生两条路,这里将分支节点存入到分支容器中,需要注意的是如果在分支容器中发现了这个分支节点,则表示之前已经达到过这个分支点,意味着出现了环,需要把环剔除,否则将分支存入容器,并。
18、且先判定分支成功的支路,然后再判断分支失败的支路,直到达到步骤(2)中所说的条件,算法结束。0014 本发明方法在编译器生成软件代码之后,采用全局遍历的策略,来确定某一个寄存器变量被后续指令访问的“生命长度”。本发明提出的算法具备在静态编译时推断寄存器变量的生命长度,并通过指令架构的支持,在指令中嵌入寄存器的生命长度,在运行时,动态调整变量的生命长度,在程序运行时根据生命长度决定是否写回,如果生命长度为零则可屏蔽对寄存器的的写回。本发明省去了不必要的寄存器的写回操作,从而降低了寄存器堆的功耗。0015 与现有的架构相比,本发明提供的软件指导的寄存器堆写回丢弃方法,能够在几乎不增加硬件开销的情况。
19、下,有效地发现可以丢弃的寄存器变量,从而降低寄存器堆的功耗和功耗密度。附图说明0016 图1是传统的6级流水线微处理器架构。0017 图2是寄存器生命长度的定义示例。0018 图3是寄存器堆写丢弃的具体判断逻辑。0019 图4是指令寄存器生命长度标签插入的具体实施策略。具体实施方式0020 本发明描述了一种软件指导的寄存器堆写回丢弃技术。以下阐述了本发明的各种实例及其中的设计思想。0021 图2 是用来说明寄存器生命长度定义的示例。如果在反馈范围内有1、2、3个后续指令用到了当前指令的目的寄存器则其生命被定义为1、2、3,如果有超出反馈范围的指令用到该寄存器,则其生命被定义为4,具体的示例,在。
20、图2中,如果$1寄存器只有其后续三条指令(即subu $3, $1, $7,lw $10, 4($1)和mul $11, $6, $1这三条指令)用到,则其生命为3,但是,如果红色所示的指令(slt $3, $1, $8)也用到了$1,则这条指令超出了$1的反馈范围,$1的生命长度将被设置为4。其中,反馈范围的定义为:当某条在译码级(D级)的指令Y用到了寄存器X时,而产生寄存器X的指令Z处在E、M或者A级,则称Y指令在Z指令产生寄存器X的反馈范围内。0022 图3展示了寄存器堆写丢弃的具体判断逻辑。与图1传统的结构相比,该结构增加了对生命周期tag的判断逻辑,图3以E级为例进行描述,M级和A级。
21、的结构完全一样。首先判断当前的指令的寄存器是否被反馈到D级(必须是反馈命中信号有效(即图3中所示的信号bypass-hit信号有效)并且此时的d级不能阻塞(即图3中所示的d_stall信号为说 明 书CN 103425460 A4/6页70),如果是的话则对当前的生命周期tag进行自减,接着判断是否当前的tag为0,为零表示当前指令寄存器的生命为0,可以丢弃,丢弃采用了基于寄存器-选择器的电路结构,该结构的特点是,如果生命tag为0,则传递给下一级的寄存器数据被保持不变,并且,表征寄存器堆写回信号X_wr_sig(X代表E、M和A,图3中以E级示例,所以X为E)将被置为0,从而屏蔽寄存器堆的写。
22、回。0023 图4展示指令寄存器生命长度标签插入的具体实施策略。实际的逻辑设计中,我们对R型指令和I型指令进行区分,对于R型指令,由于其总有5bit的冗余位,因此可以将tag插入到冗余位。对于I型指令,需要区分立即数的范围,如果立即数的范围在-40964095之间,则可以将tag插入到立即数域的高3位,否则,引入一条新的指令lli,然后将原先的指令拆分为lli指令和一条R型指令,lli指令的生命周期为1而R型指令的生命周期tag与之前的I型指令一致,并且可以有5bit的冗余位来插入tag。0024 附录展示了通过编译时静态确定/推测指令寄存器变量的生命周期的算法。算法I中所列的算法是总体的算法。
23、,调用了两个子算法,分别是:inGroupLifetimeCalculation(组内生命周期计算,如附录(II)所示)和outOfGroupWriteDiscardingJudgement(组外写丢弃判断,如附录(III)所示)。算法I的步骤是:针对当前程序的汇编代码中每条指令,首先调用算法II来计算组内的生命周期life和写丢弃信号wd,如果算法II返回了有效的wd信号(表示算法II确定在组内该寄存器可以被丢弃),那么算法I就将该指令寄存器的生命确定为life,如果life等于4,则表明在组内确定该指令的寄存器不能被丢弃,算法I就将life置为4,否则表示单调用算法II无法确定是否要丢弃,。
24、进一步调用了算法III,如果算法III确定可以丢弃,则将指令的寄存器生命周期置为算法III的返回值,否则将其置为4。0025 算法II是组内推测,其步骤是:在当前指令的后续选择3条后续指令构成一个组(group),当当前指令在延迟槽时,按照分支发生与不发生,可以获得两个组,如附录(II-a)所示。如附录(II-b)所示,再定义了三个概念:distance(距离,表示当前指令的寄存器将隔多少个时钟周期而被后续的指令用到,如果距离大于3,则一律置为4),dependent(依赖性,表示当前指令是否依赖于第一条指令,依赖意思是当前指令的操作数来自第一条指令的目的寄存器),rewrite(覆写,表示当。
25、前指令的目的寄存器是否与第一条指令一致,一致则为覆写,否则不为覆写)。如附录(II-c)所示,算法II首先获取当前指令对应的指令组,然后填写附录(II-b)所示的表格,然后开始逐一检查后续指令,1、如果发现有指令依赖于第一条指令,且距离为4,则将第一条指令的生命周期置为4,退出;2、如果有依赖且距离小于4,则生命周期加1;3、如果出现了覆写,则判断生命周期是否是4,如果是的话不能丢弃,否则可以丢弃,返回生命周期。0026 算法III是组外判断,由于本算法可以遍历整个程序,考虑到程序中可能存在的分支点,引入了一个容器来保存程序中的分支点。算法III的步骤为:1、如果判断出当前指令被后续指令使用,。
26、则表示当前指令的寄存器不能被丢弃,返回0,结束;2、否则,如果判断出当前指令的寄存器被后续的指令覆写了或者达到程序的结束出口,则开启下一轮的判断;3、如果下条指令是条件分支指令,那么必须同时判断分支是否发生两条路,这里将分支节点存入到分支容器中,需要注意的是如果在分支容器中发现了这个分支节点,则表示之前已经达到过这个分支点,意味着出现了环,需要把环剔除,否则将分支存入容器,并且先说 明 书CN 103425460 A5/6页8判定分支成功的支路,然后再判断分支失败的支路,直到达到2中所说的条件,算法结束。0027 附录算法: 生命周期的静态推测输入: 源程序汇编代码参数: 当前指令curr_i。
27、nstr, 源程序src_instr生命周期life, 写回丢弃wd, 计数器i, 指令数目instr_#输出: 生命周期数组 life_arr初始化: 将汇编代码转化为中间表达00: foreach(i0, instr_#)01: curr_instr= getInstr(i); src_instr = curr_instr02: wd=inGroupLifetimeCalculation( continue; endif /* wd有效, 取下条指令 */04: if(life = 4) life_arri = 4; continue; endif /* 不能丢弃, 下条指令 */05: 。
28、wd = outOfGroupWriteDiscardingJudgement(src_instr, curr_instr) 06: if(wd) life_arri = life; continue; endif /* wd有效,取下条指令 */07: life_arri = 4 /* 保守推测,生命周期为4,取下条指令 */08: endfor(I)算法: 组内生命周期计算输入: 当前指令curr_instr,生命周期life参数: 四条指令组group, 加速器i, 列的 distance , dependent, rewrite输出: 写丢弃 wd初始化: group = getGro。
29、up(curr_instr);fillThreeColumns(group); i = 0; life = 0; wd = 000: while(i2 wd = 0; break; endif02: if(dependenti endif;03: if(rewritei) break; endif; i+04: endwhile05: if(rewritei returnwd; endif /* rewrite 说 明 书CN 103425460 A6/6页9in-range detected */06: updateCurrInstrToLastInstrOfGroup(group); re。
30、turn wd(c)(II)算法: 组外写丢弃判断输入:源程序 src_instr,当前指令curr_instr参数: 下条指令next_instr, 分支点容器bp00: bp.clear(); bp.push_back(curr_instr)01: while(!bp.empty()02: next_instr = getNextInstr(bp.pop_back()03: while(1)04: if(isConsumer(src_instr, next_instr) return 0; endif /*发现读后写 */05: if(isRewrite(src_instr, next_i。
31、nstr) | isReachEnd(next_instr) 06: break; endif /* 没有读后写,下轮推测 */07: if(isConditionalBranch(next_instr)08: if(bp.find(next_instr) break; endif /*检测到环,下轮推测 */09: bp.push_back(next_instr) /* 没有环,保存分支点到容器 */10: next_instr = getInstrFromBranchSucc(next_instr) /* 分支成功推测 */11: endif12: else next_instr = getNextInstr(next_instr) endelse13: endwhile14: endwhile15: return 1(III)说 明 书CN 103425460 A1/2页10图1图2图3说 明 书 附 图CN 103425460 A10。