用于实现片上网络设备中的合理、低成本和/或高能效服务质量的自适应分组偏转.pdf

上传人：r7

文档编号：4042195

上传时间：2018-08-12

格式：PDF

页数：17

大小：1,016.31KB

《用于实现片上网络设备中的合理、低成本和/或高能效服务质量的自适应分组偏转.pdf》由会员分享，可在线阅读，更多相关《用于实现片上网络设备中的合理、低成本和/或高能效服务质量的自适应分组偏转.pdf（17页完整版）》请在专利查询网上搜索。

描述了用于提供自适应分组偏转以便实现片上网络(NoC)设备中的合理、低成本和/或高能效服务质量(QoS)的方法及装置。在某些实施例中，确定分组的目标端口是否已达到阈值利用率值以及是否应当响应于基于该目标端口的利用率值和该分组的优先级值确定的偏转概率值将该分组路由到替代端口。还要求和/或公开了其他实施例。。

摘要
申请专利号：	CN201380045432.8	申请日：	2013.06.25
公开号：	CN104583992A	公开日：	2015.04.29
当前法律状态：	实审	有效性：	审中
法律详情：	实质审查的生效IPC(主分类):G06F 13/18申请日:20130625\|\|\|公开
IPC分类号：	G06F13/18	主分类号：	G06F13/18
申请人：	英特尔公司
发明人：	R·王; A·萨米赫; C·麦西奥科; T-Y·泰
地址：	美国加利福尼亚州
优先权：	13/631,878 2012.09.29 US
专利代理机构：	上海专利商标事务所有限公司31100	代理人：	姬利永
PDF完整版下载：	PDF下载

内容摘要

描述了用于提供自适应分组偏转以便实现片上网络(NoC)设备中的合理、低成本和/或高能效服务质量(QoS)的方法及装置。在某些实施例中，确定分组的目标端口是否已达到阈值利用率值以及是否应当响应于基于该目标端口的利用率值和该分组的优先级值确定的偏转概率值将该分组路由到替代端口。还要求和/或公开了其他实施例。

权利要求书

权利要求书
1.  一种装置，包括：
用于确定分组的目标端口是否已达到阈值利用率值的逻辑；以及
用于响应于基于所述目标端口的利用率值和所述分组的优先级值确定的偏转概率值将所述分组路由到替代端口。

2.  如权利要求1所述的装置，其中，所述目标端口对应于所述分组到达所述分组的目的地的最小路径。

3.  如权利要求2所述的装置，其中，所述目的地被包括在所述分组的头部中。

4.  如权利要求1所述的装置，其中，所述用于路由所述分组的逻辑用于基于以下之一选择所述替代端口：所述替代端口的利用率值以及到所述分组的目的地的跳跃次数。

5.  如权利要求1所述的装置，其中，所述偏转概率值是基于所述分组的偏转数量确定的。

6.  如权利要求1所述的装置，进一步包括用于响应于确定所述分组要路由到所述替代端口而修改所述分组的优先级值的逻辑。

7.  如权利要求1所述的装置，其中，所述目标端口耦合到链路以便传输所述分组。

8.  如权利要求7所述的装置，其中，所述链路用于将第一代理耦合到第二代理，其中所述第二代理包括输入/输出设备。

9.  如权利要求8所述的装置，其中，所述链路包括点到点一致互连。

10.  如权利要求8所述的装置，其中，所述链路用于将第一代理耦合到第二代理，其中所述第一代理、所述第二代理和存储器中的一个或多个在同一集成电路芯片上。

11.  如权利要求8所述的装置，其中，所述链路包括快速外围组件互连(PCIe)链路。

12.  如权利要求1所述的装置，进一步包括用于通过链路接收所述分组的输入端口。

13.  一种方法，包括：
确定分组的目标端口是否已达到阈值利用率值；以及
响应于基于所述目标端口的利用率值和所述分组的优先级值确定的偏转概率值将所述分组路由到替代端口。

14.  如权利要求13所述的方法，进一步包括基于以下之一选择所述替代端口：所述替代端口的利用率值以及到所述分组的目的地的跳跃次数。

15.  如权利要求13所述的方法，包括基于所述分组的在先偏转数量确定所述偏转概率值。

16.  一种计算系统，包括：
路由交换逻辑，用于能够通过链路耦合第一代理和第二代理，所述路由交换逻辑包括：
用于确定所述路由交换逻辑中的分组的目标端口是否已达到阈值利用率值的逻辑；以及
用于响应于基于所述目标端口的利用率值和所述分组的优先级值确定的偏转概率值将所述分组路由到所述路由交换逻辑的替代端口的逻辑。

17.  如权利要求16所述的系统，其中，所述用于路由所述分组的逻辑用于基于以下之一选择所述替代端口：所述替代端口的利用率值以及到所述分组的目的地的跳跃次数。

18.  如权利要求16所述的系统，其中，所述偏转概率值是基于所述数据的在先偏转数量确定的。

19.  一种非瞬态计算机可读介质，包括一个或多个指令，当在处理器上执行时，所述指令将所述处理器配置成用于执行如权利要求13至15所述的一个或多个操作。

20.  一种装置，包括：
利用率逻辑，用于确定与第一端口相关联的利用率度量；以及
路由逻辑，被配置成用于响应于所述利用率度量低于利用率阈值，基于到所述第一端口的最小路径路由与所述第一端口相关联的第一分组，以及用于响应于所述利用率度量超过所述利用率阈值以及与所述第一端口相关联的第二分组与低于阈值优先级的优先级相关联，基于到第二端口的最小路径偏转所述第二分组。

21.  如权利要求20所述的装置，进一步包括控制逻辑，用于响应于所述路由逻辑将与所述第一端口相关联的所述第二分组偏转到所述第二端口，升高所述阈值优先级。

22.  如权利要求20所述的装置，其中，所述第一端口和所述第二端口通过链路耦合。

23.  如权利要求22所述的装置，其中，所述链路用于将第一代理耦合到所述第二代理，其中所述第二代理包括输入/输出设备。

24.  如权利要求22所述的装置，其中，所述链路包括点到点一致互连。

25.  如权利要求22所述的装置，其中，所述链路用于将第一代理耦合到所述第二代理，其中所述第一代理包括多个处理器核和一个或多个套接器。

说明书

说明书用于实现片上网络设备中的合理、低成本和/或高能效服务质量的自适应分组偏转
领域
本公开总体上涉及电子领域。更具体地，本发明的实施例涉及用于提供自适应分组偏转以便实现片上网络(NoC)设备中的合理、低成本和/或高能效服务质量(QoS)的技术。
背景
某些当前互连网络用于连接许多计算组件，诸如芯片多处理器(CMP)中的许多核以及集群系统中的许多节点。具有高核数量的某些片上网络(NoC)原型显示出NoC消耗整体系统功率的显著部分。而且，通过这种系统，可存在在多个核/节点上同时运行的多种多样的应用集合并且互连充当共享介质，为来自这些核的请求服务。结果是，在任何给定的情况下，可存在属于多个应用的源自不同核/节点的多个分组等级(数据和控制)。这些分组各自具有不同的服务质量(QoS)要求。这意味着互连策略应当能够支持多个流量等级，从而使得属于更高优先级等级的分组由特定的QoS要求(例如，更快的交付时间)服务。
当前的NoC-QoS方法可集中到两个主要的类别。第一，可通过向路由器引入附加队列(例如，额外的虚拟通道)、为这些不同的队列指派不同等级的分组以及用不同的优先级为其服务，实现QoS。尽管添加附加的缓冲/队列保证(至少在某种程度上)所有分组被通过最小路径路由，但是这显著地增加互连的功率预算和相关联的成本。另一方面，NoC-QoS方法的第二类别无需添加附加的缓冲；然而，它们要求对路由器架构做出重大改变，从而使得路由器不是维护FIFO(先进先出)队列，而是能以任何顺序将任何分组从可用的队列拉出并且基于其优先级为其服务。因此，这增加了互连的复杂性，并且更严重的是，其同时增加其功耗和成本。
附图简要描述
参照附图提供了详细描述。在附图中，参考标号的最左侧数位标识参考标号首次出现的附图。相同参考标号在不同图示中的使用指示类似的或完全相同的项目。
图1示出可用于实现在此讨论的各种实施例的计算系统的实施例的框图。
图2示出可用于实现在此讨论的各种实施例的计算系统的实施例的框图。
图3是根据实施例的路由交换逻辑的框图。
图4示出根据某些实施例用于QoS支持的选择性偏转策略的方法的流程图。
图5示出可用于实现在此讨论的各种实施例的计算系统的实施例的框图。
图6示出可用于实现在此讨论的各种实施例的计算系统的实施例的框图。
详细描述
在以下描述中，列出了许多特定细节以便提供各实施例的透彻理解。然而，可在没有这些特定细节的情况下实践某些实施例。在其他情况中，未详细地描述已知的方法、程序、组件、以及电路，以便不混淆具体实施例。可使用各种手段执行本发明的实施例的各个方面，诸如集成半导体电路(“硬件”)、被组织成一个或多个程序的计算机可读指令(“软件”)或硬件和软件的某种组合。为了本公开的目的，对“逻辑”的引用应当意指硬件、软件或者其某种组合。
某些实施例通过各种技术改善高速串行I/O通道的质量和/或性能。例如，这种技术用于提供自适应分组偏转以便实现片上网络(NoC)设备中的合理、低成本和/或高能效服务质量(QoS)。结果，互连可以能够在不增加功耗和/或硅面积的情况下支持QoS流量。进一步地，某些实施例为片上网络提供QoS，而不改变路由器架构或要求支持多个队列，而同时维持较高的总体吞吐量。
而且，某些实施例用于具有许多节点的多核处理器和系统(诸如基于μ集群的系统)，允许可适合目标功率预算的高能效的高性能互连。然而，QoS支持(例如，在某些当前实现方式中不使用队列)相对简单的路由器架构(导致没有或很少硅面积的增加并且不需要对路由架构进行大幅改变)，和/或更少的缓冲区及功耗(例如，由于未使用在某些当前实现方式中使用的附加队列)。
在实施例中，通过选择性地偏转低优先级分组以便避免/减少拥塞以及以便保证高优先级分组的及时递送，提供NoC和/或QoS支持。通过选择性地偏转分组，一个实施例不要求任何附加缓冲，也不要求改变路由器架构；因此，这能够在各种系统中(诸如NoC)用最小的缓冲区和简单的路由器架构实现QoS。这进而降低互连成本和功耗。同样，在实施例中，根据PCI快速基础规范3.0(修订版3.0，版本1.0，2010年11月10日)以及PCI快速基础规范修订版3.0的勘误表(2011年10月20日)实现在此讨论的互连。
在此参照计算系统组件(诸如例如在此参照图1-2和图5-6讨论的组件)讨论各实施例。更具体地，图1示出根据本发明的实施例的计算系统100的框图。系统100包括一个或多个代理102-1至102-M(在此统称为“代理102”或更一般地“代理102”)。在实施例中，代理102是计算系统(诸如在此参照图2和图5-6讨论的计算系统)的组件。
如图1所示，代理102通过网络结构104通信。在实施例中，网络结构104可包括通过串行(例如，点到点)链路和/或共享通信网络通信的一个或多个互连(或互连网络)。例如，某些实施例可便于允许与完全缓冲双内联存储器模块(EBD)通信的链路上的组件调试或验证，例如，其中，FBD链路是用于将存储器模块耦合到主机控制器设备(诸如处理器或存储器中枢)的串行链路。可从FBD通道主机传输调试信息，从而使得通过通道流量跟踪捕获工具(诸如一个或多个逻辑分析器)沿该通道观察调试信息。
在一个实施例中，系统100可支持包括物理层、链路层、路由层、传输层和/或协议层的分层协议方案。结构104可进一步便于点到点网络中的数据(例如，以分组的形式)从一个协议(例如，高速缓存处理器或高速缓存感知存储器控制器)到另一个协议的传输。同样，在某些实施例中，网络结构104可支持符合一个或多个高速缓存一致协议的通信。
进一步地，如图1中的箭头方向所示，代理102通过网络结构104传输和/或接收数据。因此，某些代理利用单向链路，而其他代理利用双向链路用于通信。例如，一个或多个代理(诸如代理102-M)传输数据(例如通过单向链路106)，其他代理(诸如代理102-2)接收数据(例如，通过单向链路108)，而某些代理(诸如代理102-1)既传输也接收数据(例如，通过双向链路110)。
同样，根据实施例，代理102中的一个或多个包括一个或多个路由交换逻辑300以便于代理(例如，所示代理102-1)和一个或多个输入/输出(“I/O”或“IO”)设备124(诸如，可根据PCI快速基础规范3.0(修订版3.0，版本1.0，2010年11月10日)以及PCI快速基础规范修版3.0的勘误表(2011年10月20日)进行操作的快速外围组件互连(PCIe)I/O设备)和/或也将进一步在此讨论(例如，参照图3至图4)的通过结构104耦合的其他代理之间的通信。同样，尽管图1示出逻辑300被包括在代理102-1中，但是逻辑300可位于系统100中的其他地方，诸如在I/O设备124内，作为耦合到网络结构104的另一个设备(诸如网络路由器)的一部分。
图2是根据实施例的计算系统200的框图。系统200包括多个套接器202-208(示出了四个但是某些实施例可具有更多或更少套接器)。每个套接器包括处理器和一个或多个路由交换逻辑300。在某些实施例中，一个或多个路由交换逻辑300可存在于系统200的一个或多个组件中(诸如图2中示出的那些)。此外，每个套接器通过点到点(PtP)链路、或差分互连 (诸如快速通道互连(QPI)、MIPI(移动产业处理器接口)等等)耦合到另一个套接器。如参照图1的网络结构104所讨论的，每个套接器耦合到系统存储器的本地部分，例如由多个包括动态随机存取存储器(DRAM)的双列直插存储器模块(DIMM)形成。
在另一个实施例中，网络结构可用于任何片上系统(SoC)应用、利用定制或标准接口(诸如ARM符合接口)，用于AMBA(高级微控制器总线架构)、OCP(开放核协议)、MIPI(移动产业处理器接口)、PCI(外围组件互连)或PCIe(快速外围组件互连)的ARM适应接口。
某些实施例使用允许在基于PC(个人计算机)的系统(诸如基于PCI的系统)中使用异构资源的技术，诸如AXI/OCP技术，而无需对IP资源本身做出任何改变。实施例提供了可用于将AXI/OCP IP插入自动生成的互连结构以便创建PCI兼容系统的两个非常薄的硬件模块，在此称为Y单元(Yunit)和垫片(shim)。在一个实施例中，Y单元的第一(例如，北)接口连接到对接到PCI兼容总线(诸如直接媒体接口(DMI)总线、PCI总线、或快速外围组件互连(PCIe)总线)的适配器模块。第二(例如，南)接口直接连接到非PC互连(诸如AXI/OCP互连)。在各实现方式中，这个总线可以是OCP总线。
在某些实施例中，Y单元通过将PCI配置循环转换为目标IP能够理解的事务，实现PCI枚举。该单元还执行从可重定位PCI地址到固定AXI/OCP地址以及相反方向的地址转换。Y单元可进一步实现排序机制以便满足生产者-消费者模型(例如，PCI生产者-消费者模型)。进而，单个IP通过专用PCI垫片连接到互连。每个垫片可为相应的IP实现整个PCI头部。Y单元将对PCI头部和设备存储器空间的所有访问路由到垫片。垫片消耗所有头部读/写事务并且将其他事务传递到IP。在某些实施例中，垫片还为IP实现所有功率管理相关的特征。
因此，不是作为单片兼容性模块，实现Y单元的实施例采取分布式方法。跨所有IP共同的功能(例如，地址转换和排序)在Y单元中实现，而IP特定功能(诸如功率管理、错误处理等等)在为该IP定制的垫片中实现。
以此方式，能够在对Y单元进行微小改变的情况下添加新IP。例如，在一种实现方式中，可通过在地址重定向表中添加新条目进行这些改变。尽管垫片是IP特定的，在某些实现方式中，大量功能(例如，大于90％)跨所有IP是共同的。这允许为新IP实现现有垫片的快速重配。因此，某些实施例还允许使用自动生成的互连结构而无需修改。在点到点总线架构中，设计互连结构可能是挑战性的任务。以上描述的Y单元方法通过最小的努力并且不要求对产业标准工具做出任何改变，将产业生态系统结合到PCI系统中。
如图2所示，每个套接器耦合到存储器控制器(MC)/家庭代理(HA)(诸如MC0/HA0至MC3/HA3)。存储器控制器耦合到相应的本地存储器(标记为MEMO至MEM3)，其可以是系统存储器(诸如图5的存储器512)的一部分。在某些实施例中，存储器控制器(MC)/家庭代理(HA)(诸如MC0/HA0至MC3/HA3)可以与图1的代理102-1相同或类似并且存储器(标记为MEM0至MEM3)与参照在此任何附图讨论的存储器设备相同或类似。总体上，处理/高速缓存代理向家庭节点发送访问与相应的“家庭代理”相关联的存储器地址的请求。同样，在一个实施例中，MEM0至MEM3可被配置成用于对数据进行镜像(例如主和从)。同样，在某些实施例中，系统200的一个或多个组件可被包括在同一个集成电路管芯上。
进一步地，一种实现方式(诸如图2所示)用于具有镜像的套接器无粘结配置。例如，指派给存储器控制器(诸如MC0/HA0)的数据被通过PtP链路镜像到另一个存储器控制器(诸如MC3/HA3)。
CMP或系统区域网络(SAN)中的NoC的某些当前实现方式具有各种拓扑，包括网格、环形以及不规则网格拓扑。这种拓扑通常体现为较大的节点连接度(例如，环形拓扑中是4度)。结果，流或分组可潜在地选择给定源-目的地对之间的多条路径之一。在自适应路由中，当分组遇到故障或拥塞路径时，其可选择另一个旁路路径，即便是在某些情况下该路径更长。这允许网络流量平衡并且可潜在地改善吞吐量和延时。然而，当前自适应路由方法通常平等地对待所有分组而不考虑对具有不同服务水平(优先级)的流量的QoS支持。
如上所述，NoC可用作连接芯片上的所有核/节点并为其提供服务的共享介质。这意味着在任何时间点，可存在具有不同节点起源和不同类型多条消息正在被通信。例如，某些消息可与具有比其他消息更高优先级的控制信令相关。进一步地，不同应用可具有不同服务水平要求(实时相对于尽力而为)。在不失慷慨的情况下，某些实施例假定存在具有优先级1(例如，作为最高优先级)的可以用非常及时的方式递送的N类流量。
某些当前实现方式通过在路由器中具有单独的队列并且根据服务水平协定基于优先级服务不同的队列，提供对不同等级的QoS支持。例如，较高优先级队列接收更多服务时间并且能够优先于较低优先级分组。这类方法引入附加单独队列的一个主要原因是以下事实：传统的路由器架构不能以乱序方式从单个FIFO队列获取分组；因此，提供附加的专用每等级队列。这类技术的缺点是多队列支持通常增加总的所需缓冲，这进而增加路由器的面积(例如，对于附加队列和任何支持逻辑)和功耗(例如，为队列及其支持逻辑操作附加逻辑)。随着系统中的节点/核的数量增加，这将变成严重问题。某些研究已经显示出通常互连负载可较低，因此更大的缓冲可浪费能量和面积。
而且，另一类方法通过放弃传统、简单的路由器架构并且引入能够以非特定顺序(即，不尊重其FIFO顺序)从给定队列拉出分组的复杂架构，解决了路由器不能以乱序方式从队列获取分组的问题。尽管这些方法不引入附加缓冲，其仍需要通过其自身消耗大量功率并且增加互连成本和面积的复杂路由器设计。对比之下，某些实施例提供互连QoS支持，而不要求多个队列也不改变路由器架构。
图3是根据实施例的路由交换逻辑300的框图。逻辑300选择性地偏转分组的路由，用于QoS支持。当分组302到达输入端口303时，路由交换逻辑304检查与所接收的分组302的目的地相关联的目标端口(例如，输出端口306)的利用率(例如，其中目的地是由分组302的头部内的目的地址或伴随信息等等标识的)。如果利用率较高(例如，在输出端口306)，针对最高优先级流量，仍可被发送到目标端口306。然而，对于较低优先级分组，更有可能的是其将被偏转到较少利用的端口(例如，输出端口308)，尽管该端口不是目标端口。最终，较低优先级分组将在替代路径上到达目的地，这比最小路径耗费更多遍历时间。通过这样做，较高优先级分组的QoS得到支持。
在实施例中，当网络的负载较轻时，通过最小路径路由所有分组以便实现最小路由延时和能耗。当特定端口的利用率增加时(例如，当与阈值利用率值相比时，这可基于临近这些端口的一个或多个传感器检测到的信息)，逻辑304将选择性地将一个或多个较低优先级分组偏转到其他端口以便避免或降低进一步的拥塞，即使其他端口不是最小路径上到目的地的端口。这种方法进而降低或避免较高优先级流量及其及时传送的进一步拥塞。而且，由于这种方法平衡不同端口上的负载，可同时实现较高的整体网络吞吐量。为了避免活锁(即，其中重复地偏转分组)，在每次分组偏转时逐渐地增加被偏转分组的优先级。这进而可保证即使针对低优先级分组，其最终会被传送到其目的地，而不是无尽地偏转。
图4示出根据某些实施例用于QoS支持的选择性偏转策略的方法的流程图。在各实施例中，参照图4讨论的操作由参照图1-3和/或图5-6所讨论的组件中的一个或多个执行。
参考图4，当在操作402接收到分组并且目标端口的利用率高于(或者处于)如在操作404确定的特定阈值时，其表明需要偏转某些分组以便避免进一步的拥塞。在这种情况下，在操作406，基于以下因素计算将分组偏转到非目标端口的概率：
(1)目标端口的利用率，利用率越高，偏转概率越高(这种情况的原因是为了防止目标端口的饱和以及拥塞，以及为了确保较高优先级分组的及时传送)；和/或
(2)分组的优先级，较低优先级分组更可能被偏转(同时另一方面具有较高优先级的分组更不可能被偏转)。
相应地，在某些实施例中，基于概率的偏转机制用于提供QoS。例如，使用以下公式计算偏转概率：
P＝a×{目标端口利用率-利用率阈值)×(n/N)其中，“a”是缩放因子(可以是实验地确定的)，“n”是分组的优先级[1,2,3,...]，其中1是最高优先级，并且“N”是流量级别的总数。
使用该公式，当目标端口的利用率值高于阈值时，较低优先级分组具有较高偏转机会。当选择要偏转到其上的替代端口时，在实施例中首先考虑具有较低利用率的替代端口以及也不增加到目的地的跳跃次数的端口。另一个重要方面是确保即便较低优先级的分组被最终传送到目的地，例如通过应用老化机制。例如，每当如在操作408确定的那样偏转分组时，其优先级在操作410增加特定值，从而使得其将更不可能在下一跳跃处被偏转。优先级增量的宽度可以是设计参数。在操作412，分组被发送到非目标端口。如图4所示，如果在操作404不满足阈值或者分组未在操作408偏转，分组在操作414被发送到目标端口。同样，在操作412和414之后，该方法在操作402恢复以便接收下一个分组。
在一个实施例中，为了避免或者至少降低活锁的机会，“偏转计数器”对分组遇到的偏转数量进行计数，并且当计算以上讨论的偏转概率时，该计数器值被考虑在内。例如，偏转计数器的值越高，偏转概率越低。同样，即使在所有分组都具有相同的优先级(N＝l)的情况下，某些实施例仍用作扩散拥塞和实现总体高吞吐量的高效和低开销方法。
进一步地，可通过向分组指派优先级值表示目标QoS水平。这些优先级值可具有用户级别含义或实现(例如，针对给定应用的用户选择QoS水平可通过OS向下传播到互连)、硬件级别含义或实现(例如，硬件给予控制分组比数据分组更高的优先级)、或二者的组合。
图5示出根据本发明的实施例的计算系统500的框图。计算系统500包括通过互连网络(或者总线)504通信的一个或多个中央处理单元(CPU)502-1至502-N或者处理器(在此统称为“多个处理器502”或者更一般地“处理器502”)。处理器502包括通用处理器、网络处理器(其处理通过计算机网络503传递的数据)、或者其他类型的处理器(包括精简指令集计算机(RISC)或者复杂指令集计算机(CISC))。而且，处理器502具有单核或多核设计。具有多核设计的处理器502可在同一个集成电路(IC)管芯上集成不同类型的处理器核。同样，具有多核设计的处理器502可被实现为对称或非对称多核处理器。
同样，参照图1-4讨论的操作可由系统500的一个或多个组件执行。在某些实施例中，处理器502可以与图2的处理器202-208相同或类似。进一步地，处理器502(或者系统500的其他组件)包括一个或多个路由交换逻辑300。而且，即使图5示出逻辑300的一些位置，这些组件可位于系统500中的任何其他地方。例如，I/O设备124经由总线522通过逻辑300通信。
芯片组506也与互连网络504通信。芯片组506包括图形存储器控制器中枢(GMCH)508。GMCH 508包括与存储器512通信的存储器控制器510。存储器512存储数据，包括由CPU 502或包括在计算系统500内的任何其他设备执行的指令序列。例如，存储器512存储与如参照以上图示讨论的操作系统(OS)513和/或设备驱动器511相对应的数据。在实施例中，图1的存储器512和存储器140可以是相同的或类似的。在本发明的一个或多个实施例中，存储器512可包括一个或多个易失性存储(或存储器)设备，诸如随机存取存储器(RAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、静态RAM(SRAM)、或者其他类型的存储设备。还可利用非易失性存储器，诸如硬盘。附加设备可通过互连网络504通信，诸如多个CPU和/或多个系统存储器。
此外，在某些实施例中，处理器502中的一个或多个可访问一个或多个高速缓存(其可在各实施例中包括私用和/或共享高速缓存)以及相关联的高速缓存控制器(未示出)。高速缓存可符合一个或多个高速缓存一致协议。高速缓存存储由系统500的一个或多个组件利用的数据(例如，包括指令)。例如，高速缓存本地高速缓存存储在存储器512中的数据以便由处理器502的组件更快地访问。在实施例中，高速缓存(其可以是共享的)可包括中级高速缓存和/或末级高速缓存(LLC)。同样，每个处理器 502包括1级(L1)高速缓存。处理器502的各组件直接通过总线或互连网络和/或存储器控制器或中枢与高速缓存通信。
GMCH 508还包括例如通过图形加速器与显示设备516通信的图形接口514。在本发明的一个实施例中，图形接口514可通过加速图形端口(AGP)与图形加速器通信。在本发明的实施例中，显示器516(诸如平板显示器)可通过例如信号转换器与图形接口514通信，该信号转换器将存储在存储设备(诸如视频存储器或系统存储器)中的图像的数字表示转换为由显示器516解释并显示的显示信号。显示设备所产生的显示信号在由显示器516解释并且后续在其上显示之前传递通过各控制设备。
中枢接口518允许GMCH 508与输入/输出控制中枢(ICH)520通信。ICH 520提供到与计算系统500通信的I/O设备的接口。ICH 520通过外围网桥(或控制器)524(诸如外围组件互连(PCI)桥、通用串行总线(USB)控制器、或其他类型的外围桥或控制器)与总线522通信。桥524提供CPU502与外围设备之间的数据路径。可利用其他类型的拓扑。同样，多条总线可通过例如多个桥或控制器与ICH 520通信。而且，与ICH 520通信的其他外围设备在本发明的各实施例中可包括集成驱动电子设备(IDE)或小型计算机系统接口(SCSI)硬盘驱动器、USB端口、键盘、鼠标、并行端口、串行端口、软盘驱动器、数字输出支持(例如，数字视频接口(DVI))、或其他设备。
总线522与音频设备526、一个或多个盘驱动器528、以及网络接口设备530(其与计算机网络503通信)通信。其他设备通过总线522通信。同样，在本发明的某些实施例中，各组件(诸如网络接口设备530)可与GMCH508通信。在实施例中，处理器502以及GMCH 508的一个或多个组件和/或芯片组可以组合以便形成单个集成电路芯片(或者以其他方式在同一个集成电路芯片上存在)。
进一步地，计算系统500可包括易失性和/或非易失性存储器(或存储设备)。例如，非易失性存储器可包括以下一项或多项：只读存储器(ROM)、可编程ROM(PROM)、可擦PROM(EPROM)、电EPROM(EEPROM)、盘驱动器(例如，528)、软盘、致密盘ROM(CD-ROM)、数字通用盘(DVD)、闪存、磁光盘、或能够存储电子数据(例如，包括指令)的其他类型的非易失性机器可读介质。
图6示出根据本发明的实施例的安排在点到点(PtP)配置中的计算系统600。具体的，图6示出其中通过多个点到点接口互连的处理器、存储器和输入/输出设备的系统。参照图1-5讨论的操作由系统600的一个或多个组件执行。
如图6所示，系统600包括若干个处理器，为了清晰仅示出两个处理器，处理器602和604。处理器602和604各自包括本地存储器控制器中枢(MCH)606和608以便允许与存储器610和612进行通信。存储器610和/或612存储各种数据，诸如参照图5的存储器512讨论的那些。在实施例中，处理器602和604还包括参照图5讨论的高速缓存。
在实施例中，处理器602和604可以是参照图5讨论的处理器502之一。处理器602和604分别使用点到点(PtP)接口电路616和618通过PtP接口614交换数据。同样，处理器602和604各自使用点到点接口电路626、628、630和632经由各个PtP接口622和624与芯片组620交换数据。芯片组620进一步例如使用PtP接口电路637经由高性能图形接口636与高性能图形电路634交换数据。
在处理器602和604或芯片组620中提供本发明的至少一个实施例。例如，处理器602和604和/或芯片组620包括一个或多个路由交换逻辑300。然而，本发明的其他实施例可存在于图6的系统600内的其他电路、逻辑单元或设备中。进一步地，本发明的其他实施例可在图6中示出的若干电路、逻辑单元或设备之间分布。因此，图6中示出的逻辑300的位置是示例性的并且可在或者可不在所示位置提供这种组件。
芯片620使用PtP接口电路641与总线640通信。总线640与一个或多个设备通信，诸如总线桥642和I/O设备643。通过总线644，总线桥642与其他设备通信，诸如键盘/鼠标645、通信设备646(诸如调制解调器、网络接口设备或通过计算机网络503通信的其他通信设备)、音频I/O设备、和/或数据存储设备648。数据存储设备648存储可由处理器602和/或604执行的代码649。
在本发明的各实施例中，例如在此参照图1-6讨论的操作可被实现为硬件(例如，电路)、软件、固件、微代码或其组合，其可被提供为计算机程序产品，例如包括具有存储在其上的用于将计算机编程为执行在此讨论的过程的(例如，非瞬态)机器可读或(例如，非瞬态)计算机可读介质。术语“逻辑”可包括例如软件、硬件和/或软件和硬件的组合。机器可读介质可包括存储设备，诸如参照图1-6讨论的那些。此外，这种计算机可读介质可被下载为计算机程序产品，其中，该程序可通过经由载波或经由通信链路(例如，总线、调制解调器或网络连接)的其他传播介质传输的数据信号从远程计算机(例如，服务器)传输到请求计算机(例如，客客户机)。
在说明书中对“一个实施例”或“实施例”的引用是指在此结合该实施例所描述的特定特征、结构或特性可被包括至少一种实现方式中。在说明书中，短语“在一个实施例中”在各种地方的出现并非必须全部指代相同的实施例。
同样，在说明书和权利要求书中，可使用术语“耦合”和“连接”及其衍生词。在本发明的某些实施例中，“连接”可用于指示两个或更多个元件与彼此直接物理接触或电接触。“耦合”可意指两个或更多个元件直接物理接触或电接触。然而，“耦合”还可意指两个或更多个元件可不彼此直接接触但是可仍彼此合作或交互。
因此，尽管已经用结构特征和/或方法动作特定的语言描述了本发明的实施例，应当理解的是所要求保护的主题可不限于所描述的特定特征或动作。而是，特定特征和动作被公开为实现所要求保护的主题的样本形式。