《高性能计算服务平台中的资源管理系统和方法.pdf》由会员分享,可在线阅读,更多相关《高性能计算服务平台中的资源管理系统和方法.pdf(7页完整版)》请在专利查询网上搜索。
1、(10)申请公布号 CN 103176851 A(43)申请公布日 2013.06.26CN103176851A*CN103176851A*(21)申请号 201310128230.1(22)申请日 2013.04.12G06F 9/50(2006.01)(71)申请人上海超级计算中心地址 201203 上海市浦东新区郭守敬路585号(72)发明人李根国 徐彬 刘杰 陈家慧刘祎洋 乔明奎 龙文明(74)专利代理机构上海思微知识产权代理事务所(普通合伙) 31237代理人郑玮(54) 发明名称高性能计算服务平台中的资源管理系统和方法(57) 摘要本发明提供了一种高性能计算服务平台中的资源管理系统。
2、和方法,包括:若干个资源拥有者将资源接入若干个集群接入器;所述资源管理中心按行业或领域将所有所述资源形成不同的资源域进行管理;门户显示所述资源域,用户通过门户使用资源域中的资源。通过资源动态接入,对资源进行分类和抽象,整合异构资源,实现了资源类型的可扩展性。采用面向用户的按行业或领域划分的资源管理模式,实现资源有效分配和充分共享,提高资源使用的效率。此外,通过资源副本管理,解决资源信息失效及更新的问题,提高用户访问资源定位的效率。并且,指定资源的使用规模和优先级,更准确的满足应用环境中用户对资源访问控制和资源调度的需求。(51)Int.Cl.权利要求书1页 说明书4页 附图1页(19)中华人民。
3、共和国国家知识产权局(12)发明专利申请权利要求书1页 说明书4页 附图1页(10)申请公布号 CN 103176851 ACN 103176851 A1/1页21.高性能计算服务平台中的资源管理方法,其特征在于,包括:若干个资源拥有者将资源接入若干个集群接入器;所述资源管理中心按行业或领域将所有所述资源形成不同的资源域进行管理;门户显示所述资源域,用户通过所述门户使用资源域中的资源。2.根据权利要求1所述的高性能计算服务平台中的资源管理方法,其特征在于,若干个资源拥有者将资源接入若干个集群接入器的步骤包括:若干个资源拥有者将资源的动态信息接入若干个集群接入器,其中,所述资源的动态信息包括:通。
4、过通用资源标识符正确的描述资源及资源访问方式,生成资源的唯一标识符;将资源的动态信息合并到资源管理中心,建立集中资源信息索引;将资源的动态信息传输至门户。3.根据权利要求2所述的高性能计算服务平台中的资源管理方法,其特征在于,当资源发生变化,资源管理中心更新集中资源信息索引。4.根据权利要求1所述的高性能计算服务平台中的资源管理方法,其特征在于,所述资源管理中心按行业或领域将所有所述资源形成不同的资源域进行管理的步骤包括:资源管理中心收集资源的信息;资源管理中心按行业或领域将所有所述资源形成不同的资源域;用户根据自己所在的行业或领域向资源管理中心预约所述资源。5.根据权利要求1所述的高性能计算。
5、服务平台中的资源管理方法,其特征在于,还包括:在所述门户保存所述资源域的资源信息副本。6.根据权利要求5所述的高性能计算服务平台中的资源管理方法,其特征在于,当所述资源信息副本过时或资源信息副本验证失败时,将重新到所述资源管理中心更新所述资源域的资源信息副本。7.根据权利要求1所述的高性能计算服务平台中的资源管理方法,其特征在于,还包括:在资源管理中心指定资源的使用规模和优先级。8.根据权利要求7所述的高性能计算服务平台中的资源管理方法,其特征在于,所述使用规模和优先级包括:作业数,用于限定用户同时计算的作业数量;Slots数,用户限定用户单个作业的规模;优先级,用于限定用户的优先级及用户所在。
6、项目的优先级。9.高性能计算服务平台中的资源管理系统,其特征在于,包括:若干个集群接入器,用于收集若干个资源拥有者的资源;资源管理中心,用于按行业或领域将所有所述资源形成不同的资源域进行管理;门户,用于显示所述资源域,用户通过所述门户使用资源域中的资源。权 利 要 求 书CN 103176851 A1/4页3高性能计算服务平台中的资源管理系统和方法 技术领域0001 本发明涉及资源管理技术,特别涉及一种高性能计算服务平台中的资源管理系统和方法。 背景技术0002 资源管理是用来描述和管理资源及其相关属性和关系的技术。随着高性能计算技术的不断发展,应用范围不断扩大,高性能计算应用呈现多集群、分布。
7、式、多应用的发展趋势,而传统的高性能计算资源管理模式单一、可扩展性和适应性差,难以满足用户多样性的需求。主要体现在以下几个方面: 0003 资源的异构性。在高性能计算应用环境中,资源种类繁多,不同的资源具有不同类型和不同的性能特征。资源不再狭义的被定义为某种物理实体,而是表示在网络化环境中可被共享和利用的任何能力,包括计算资源、存储资源、网络资源、应用软件资源、信息资源等。资源具有分布、异构的特点,如何实现异构环境下对资源的统一配置和管理是一个难点问题; 0004 资源的动态性。在高性能计算应用环境中,资源可能跨多个管理域,资源的状态动态变化,资源信息具有不确定性,资源的配置和能力也在动态变化。
8、。因此,资源管理机制需要具有一定的自适应性,能够有效且高效的利用资源,并具备一定的容错处理能力; 0005 用户需求多样性。用户来自于不同的行业、不同的组织机构,不同的用户对资源授权、访问控制和隶属关系的要求也不尽相同。因此,高性能计算服务平台的资源管理机制必须具有灵活性和可配置性,满足不同企业或用户组织的多个业务系统对用户权限控制的实际需求,而平台能够支持的资源种类、数目和粒度,直接影响着用户授权和访问控制的实施效果; 0006 层次模型是当前大部分系统所使用的资源管理模型。这种模型采用层次化的方法对资源进行管理,每层都有一个或多个资源管理器,通过局部资源管理 器和全局资源管理器之间的协调或。
9、多个局部资源管理器之间的协调,实现整个系统中的资源管理。采用层次模型,能够较好的解决资源异构性,维护节点资源管理的自治性,同时具有良好的可扩展性。但是同时也存在着一些问题,如缺乏对资源预约的支持,以及无法很好适应应用环境中资源供需的动态变化等。 发明内容0007 本发明的目的在于提供一种高性能计算服务平台中的资源管理系统和方法以解决现有技术的高性能计算资源管理模式单一、可扩展性和适应性差,难以满足用户多样性的需求的问题。 0008 为解决上述技术问题,本发明提供: 0009 高性能计算服务平台中的资源管理方法,包括: 0010 若干个资源拥有者将资源接入若干个集群接入器; 说 明 书CN 10。
10、3176851 A2/4页40011 所述资源管理中心按行业或领域将所有所述资源形成不同的资源域进行管理; 0012 门户显示所述资源域,用户通过所述门户使用资源域中的资源。 0013 可选的,在所述的高性能计算服务平台中的资源管理方法中,若干个资源拥有者将资源接入若干个集群接入器的步骤包括: 0014 若干个资源拥有者将资源的动态信息接入若干个集群接入器,其中,所述资源的动态信息包括:通过通用资源标识符正确的描述资源及资源访问方式,生成资源的唯一标识符; 0015 将资源的动态信息合并到资源管理中心,建立集中资源信息索引; 0016 将资源的动态信息传输至门户。 0017 可选的,在所述的高。
11、性能计算服务平台中的资源管理方法中,当资源发生变化,资源管理中心更新集中资源信息索引。 0018 可选的,在所述的高性能计算服务平台中的资源管理方法中,所述资源管理中心按行业或领域将所有所述资源形成不同的资源域进行管理的步骤包括: 0019 资源管理中心收集资源的信息; 0020 资源管理中心按行业或领域将所有所述资源形成不同的资源域; 0021 用户根据自己所在的行业或领域向资源管理中心预约所述资源。 0022 可选的,在所述的高性能计算服务平台中的资源管理方法中,还包括:在所述门户保存所述资源域的资源信息副本。 0023 可选的,在所述的高性能计算服务平台中的资源管理方法中,当所述资源信息。
12、副本过时或资源信息副本验证失败时,将重新到所述资源管理中心更新所述资源域的资源信息副本。 0024 可选的,在所述的高性能计算服务平台中的资源管理方法中,还包括:在资源管理中心指定资源的使用规模和优先级。 0025 可选的,在所述的高性能计算服务平台中的资源管理方法中,所述使用规模和优先级包括: 0026 作业数,用于限定用户同时计算的作业数量; 0027 Slots数,用户限定用户单个作业的规模; 0028 优先级,用于限定用户的优先级及用户所在项目组的优先级。 0029 同时,本发明还提供高性能计算服务平台中的资源管理系统,包括: 0030 若干个集群接入器,用于收集若干个资源拥有者的资源。
13、; 0031 资源管理中心,用于按行业或领域将所有所述资源形成不同的资源域进行管理; 0032 门户,用于显示所述资源域,用户通过所述门户使用资源域中的资源。 0033 本发明提供的高性能计算服务平台中的资源管理系统和方法,具有以下有益效果:通过资源动态接入,对资源进行分类和抽象,整合异构资源,实现了资源类型的可扩展性。采用面向用户的按行业或领域划分的资源管理模式,实现资源有效分配和充分共享,提高资源使用的效率。 0034 此外,通过资源信息副本管理,解决资源信息失效及更新的问题,提高用户访问资源定位的效率。并且,通过指定资源的使用规模和优先级,更准确的满足应用环境中用户对资源访问控制和资源调。
14、度的需求。 说 明 书CN 103176851 A3/4页5附图说明0035 下面将结合附图及实施例对本发明作进一步说明,附图中: 0036 图1是高性能计算服务平台中的资源管理系统的结构示意图; 0037 图2是高性能计算服务平台中的资源管理方法的流程示意图。 具体实施方式0038 以下结合附图和具体实施例对本发明提出的高性能计算服务平台中的资源管理系统和方法作进一步详细说明。根据下面说明和权利要求书,本发明的优点和特征将更清楚。需说明的是,附图均采用非常简化的形式且均使用非精准的比例,仅用以方便、明晰地辅助说明本发明实施例的目的。 0039 本发明提出了一种高性能计算服务平台资源管理技术及。
15、其实现方法。在层次模型的基础上,面向用户权限控制的实际需求,建立了以用户为中心而不是以系统为中心的资源管理策略,能较好的适应应用环境和用户需求的变化,具有良好的适用性和可操作性。 0040 如图1所示,高性能计算服务平台中的资源管理系统10,包括: 0041 若干个集群接入器11,用于收集若干个资源拥有者12的资源13; 0042 资源管理中心14,用于按行业或领域将所有所述资源13形成不同的资源域进行管理;其中,所述资源管理中心14包括:企业管理模块、软件管理模块、集群管理,列队管理模块、用户管理模块和计算机资源权限管理模块。 0043 门户15,用于显示所述资源域,用户通过所述门户15使用。
16、资源域中的资源。 0044 高性能计算服务平台中的资源管理系统采用Portal(门户)-Router(资源管理中心)-Cluster(集群接入器)三层系统架构,提供统一视图进行资源管理和监控,并在统一资源管理技术基础上提供面向不同企业或用户组织的独立的、互不干扰的资源管理策略。其中,Portal采用J2EE架构,Router和Cluster采用面向服务的体系结构,分别部署了相对独立的对外开放的服务接口。 0045 如图2所示,使用所述的高性能计算服务平台中的资源管理系统,提供一种高性能计算服务平台中的资源管理方法,包括: 0046 S21:若干个资源拥有者将资源接入若干个集群接入器; 0047。
17、 资源接入主要包括三个阶段:接入、合并和传输。 0048 接入阶段:若干个资源拥有者将资源的动态信息接入若干个集群接入器,其中,所述资源的动态信息包括:通过通用资源标识符(URI,Uniform Resource Identifier)正确的描述资源及资源访问方式,生成资源的唯一标识符; 0049 合并阶段:将资源的动态信息合并到资源管理中心,建立集中资源信息索 引; 0050 传输阶段:将资源的动态信息传输至门户。 0051 当资源发生变化,资源管理中心更新集中资源信息索引可重新定位资源,从而实现资源的动态接入。 0052 S22:所述资源管理中心按行业或领域将所有所述资源形成不同的资源域进。
18、行管理; 0053 在资源管理中心维护一份资源信息索引来管理接入的资源信息,通过集中资源信说 明 书CN 103176851 A4/4页6息索引获取资源URI而后进一步定位资源。 0054 资源管理中心进行管理主要包括: 0055 资源管理中心收集资源的信息;其中,资源的信息包括:用户应用的使用情况、资源拥有者的动态信息、管理员的管理信息等; 0056 资源管理中心按行业或领域将所有所述资源形成不同的资源域; 0057 具体的,依据用户的权限以及用户使用资源的一些描述分配资源。 0058 用户根据自己所在的行业或领域向资源管理中心预约所述资源。 0059 具体的,用户在正式使用资源之前,向资源。
19、拥有者请求其使用时段内把所需资源预约给自己使用,并保证所需的服务质量,具体的预约请求包括CPU数目、软件使用许可证数目等。 0060 S23:门户显示所述资源域,用户通过所述门户使用资源域中的资源。 0061 在本发明中,资源信息集中存放在资源管理中心,同时,在门户保存所述资源域的资源信息副本,以便于用户在访问资源时可快速定位。当资源信息副本过时或资源信息副本验证失败时,会导致资源信息副本失效,失效的资源副本将自行删除,重新到资源管理中心更新所述资源域的资源信息副本。 0062 导致资源信息副本失效主要有两类原因:资源信息副本过时。不同资源,根据其特性,资源信息副本会有不同的过期时间,在超过时。
20、限后,资源副本将自行失效删除,不会被再次访问;资源信息副本验证失败。当用户使用资源信息副本的信息去访问资源时,如果失败则立即将资源信息副本置为失效状态,抛弃该资源信息副本,重新定位该资源最新信息。 0063 当资源信息副本失效时需要对资源副本进行更新,以免失效信息造成资源使用故障。资源信息副本更新主要采用两种形式:定时更新,可根据不同资 源设置不同的定时器,定时更新资源信息副本到最新版本,保证资源信息副本可正常使用。更新频率至关重要,频繁的更新可以及时反映资源的实际信息,但会增加通信的负担;当资源信息副本验证失败时认定副本信息过时,立即更新一次原资源信息。 0064 在本发明中,在资源管理中心。
21、将资源分配给用户时,可具体指定资源的使用规模和优先级。其中,所述使用规模和优先级包括: 0065 作业数,用于限定用户同时计算的作业数量; 0066 Slots数,用户限定用户单个作业的规模; 0067 优先级,用于限定用户的优先级及用户所在项目组的优先级。 0068 充分考虑了资源的稀缺性,从资源权限控制角度提供细粒度的权限管理制度,能够更准确的满足应用环境中用户对资源访问控制和资源调度的需求。 0069 上述描述仅是对本发明较佳实施例的描述,并非对本发明范围的任何限定,本发明领域的普通技术人员根据上述揭示内容做的任何变更、修饰,均属于权利要求书的保护范围。 说 明 书CN 103176851 A1/1页7图1图2说 明 书 附 图CN 103176851 A。