横向关联家系调查方法及系统技术领域
本发明涉及检测人体基因组中具有多态性的遗传标记技术领域,尤其是涉及横向
关联家系调查方法及系统。
背景技术
传统的Y-STR(Short Tandem Repeat,短串联重复序列)数据库建设模式以家系为
基点,以家系谱图为单元,包括家系调查、家系图谱绘制、家系人员信息录入、家系样本采集
与保管、家系样本检验及入库、现场Y库建设及比对系统应用等多个环节。其中完整而准确
的家系图谱的绘制是建设该数据库的基础,也是保证数据库质量的前提。目前,以河南省为
代表的先行者在探索建设Y-STR数据库的过程中,尤其在完成农村地区的家系调查、图谱绘
制和家系录入工作中投入了大量的精力和时间。正如他们所说的“全市的刑警、治安警一个
村一个村、一个家族一个家族的画家系,建成这个库,非常不容易”。
家系是通过调查认为Y-STR一致的人员的总称,他们的关系是遗传关系,实际生活
中,人与人之间是通过生活关系组建成的一个个家庭,这些人的Y-STR分型就有可能不完全
一致,这就对建库的调查工作带来很大的难度。
发明内容
有鉴于此,本发明的目的在于提供横向关联家系调查方法及系统,以降低人力资
源和成本,提高建库的高效性和准确性。
第一方面,本发明实施例提供了一种横向关联家系调查方法,其中,包括:
对每个家庭中具有父系遗传关系的第一成员组进行选取,从而构建多个家庭单
元;
分别对多个所述家庭单元进行资料采集,得到多组单元信息;
将多组所述单元信息录入到数据库,并将多组所述单元信息与所述数据库中的信
息进行对比和匹配,得到对比结果信息;
根据所述对比结果信息,将多组所述家庭单元进行关联组成多组父系亲属关系
网。
结合第一方面,本发明实施例提供了第一方面的第一种可能的实施方式,其中,所
述单元信息包括户内信息和户外信息,所述分别对多个所述家庭单元进行资料采集,得到
多组单元信息包括,重复执行以下处理,直至每个所述家庭单元都被遍历:
选取所述第一成员组中首辈分成员,并以所述首辈分成员为基础向上延伸多代直
系亲属,得到第二成员组;
选取所述第一成员组的非本户亲兄弟成员,得到第三成员组;
对所述第一成员组进行资料采集,得到所述户内信息;
对所述第二成员组和所述第三成员组进行资料采集,得到所述户外信息。
结合第一方面,本发明实施例提供了第一方面的第二种可能的实施方式,其中,所
述单元信息还包括身份信息和配偶姓名信息,所述将多组所述单元信息与所述数据库中的
信息进行对比和匹配,得到对比结果信息包括:
将多组所述身份信息与所述数据库中的信息进行对比,得到主要对比信息;
将多组所述配偶姓名信息与所述数据库中的信息进行对比,得到辅助对比信息;
根据所述辅助对比信息,对所述主要对比信息进行补充,得到所述对比结果信息。
结合第一方面,本发明实施例提供了第一方面的第三种可能的实施方式,其中,所
述根据所述对比结果信息,将多组所述家庭单元进行关联组成父系亲属关系网包括:
判断所述对比结果信息是否匹配;
如果匹配,则将多组所述家庭单元进行统计并互相关联,组成多组所述父系亲属
关系网。
结合第一方面,本发明实施例提供了第一方面的第四种可能的实施方式,其中,所
述多代直系亲属包括两代直系亲属。
第二方面,本发明实施例还提供一种横向关联家系调查系统,其中,包括:
构建器,用于对每个家庭中具有父系遗传关系的第一成员组进行选取,从而构建
多个家庭单元;
采集器,用于分别对多个所述家庭单元进行资料采集,得到多组单元信息;
对比器,用于将多组所述单元信息录入到数据库,并将多组所述单元信息与所述
数据库中的信息进行对比和匹配,得到对比结果信息;
Y网获取器,用于根据所述对比结果信息,将多组所述家庭单元进行关联组成多组
父系亲属关系网。
结合第二方面,本发明实施例提供了第二方面的第一种可能的实施方式,其中,所
述单元信息包括户内信息和户外信息,所述采集器包括,重复执行以下处理,直至每个所述
家庭单元都被遍历:
选取所述第一成员组中首辈分成员,并以所述首辈分成员为基础向上延伸多代直
系亲属,得到第二成员组;
选取所述第一成员组的非本户亲兄弟成员,得到第三成员组;
对所述第一成员组进行资料采集,得到所述户内信息;
对所述第二成员组和所述第三成员组进行资料采集,得到所述户外信息。
结合第二方面,本发明实施例提供了第二方面的第二种可能的实施方式,其中,所
述单元信息还包括身份信息和配偶姓名信息,所述对比器包括:
将多组所述身份信息与所述数据库中的信息进行对比,得到主要对比信息;
将多组所述配偶姓名信息与所述数据库中的信息进行对比,得到辅助对比信息;
根据所述辅助对比信息,对所述主要对比信息进行补充,得到所述对比结果信息。
结合第二方面,本发明实施例提供了第二方面的第三种可能的实施方式,其中,所
述Y网获取器包括:
判断所述对比结果信息是否匹配;
如果匹配,则将多组所述家庭单元进行统计并互相关联,组成多组所述父系亲属
关系网。
结合第二方面,本发明实施例提供了第二方面的第四种可能的实施方式,其中,所
述多代直系亲属包括两代直系亲属。
本发明提供的横向关联家系调查方法及系统,通过对每个家庭中具有父系遗传关
系的第一成员组进行选取,从而构建多个家庭单元,分别对多个家庭单元进行资料采集,得
到多组单元信息,将多组单元信息录入到数据库,并将多组单元信息与数据库中的信息进
行对比和匹配,得到对比结果信息,根据对比结果信息,将多组家庭单元进行关联组成多组
父系亲属关系网。本发明可以提高建设家系图谱信息库的高效性、完整性和准确性,并可以
降低人力资源和成本。
本发明的其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变
得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点在说明书、权利要求书
以及附图中所特别指出的结构来实现和获得。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合
所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体
实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的
附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前
提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例一提供的横向关联家系调查方法流程图;
图2为本发明实施例一提供的横向关联家系调查方法中步骤S120的流程图;
图3为本发明实施例一提供的横向关联家系调查方法中步骤S130的流程图;
图4为本发明实施例一提供的横向关联家系调查方法中步骤S140的流程图;
图5为本发明实施例二提供的横向关联家系调查系统示意图。
图标:
100-构建器;200-采集器;300-对比器;400-Y网获取器。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明
的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是
全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提
下所获得的所有其他实施例,都属于本发明保护的范围。
目前农村人口流动大,频现外来人员迁入家系、家系人员外迁、收养、入赘、改姓、
非婚生子及娶妻带子女等现象,以及某些家系溯源不清楚等情况,如果仅仅依靠各县级公
安机关治安管理部门和派出所进行人工绘制家系图谱,不但很容易出现家系图谱信息不完
整、不准确等问题,而且需要大量的人力和复杂的工作量。传统的Y-STR数据库建库对地域
的条件有很高的要求,多为流动人口少、较偏僻的农村,辖区内有一定数量的成规模的家
系、家谱清晰或通过调查走访能建立完整的家系图。基于此,本发明采用以户(家庭)为调查
对象,借助计算机技术的高储存、高效检索及自动比对技术来横向关联具有父系亲属关系
(亲兄弟关系)的户(家庭),构建“父系亲属关系网”来代替人工绘制的树状结构家系图谱,
从而减轻了人力、物力,提高了建库的高效性、准确性。本方法把Y-STR一致的遗传关系和家
庭的生活关系进行了有机的结合,树立了一个全新的概念“父系亲属关系网”,网格化管理Y
数据,简称Y网。也就是,本发明实施例提供的横向关联家系调查方法及系统,可以提高建设
家系图谱信息库的高效性、完整性和准确性,并可以降低人力资源和成本。
为便于对本实施例进行理解,首先对本发明实施例所公开的横向关联家系调查方
法进行详细介绍。
实施例一:
图1为本发明实施例一提供的横向关联家系调查方法流程图。
参照图1,向关联家系调查方法包括如下步骤:
步骤S110,对每个家庭中具有父系遗传关系的第一成员组进行选取,从而构建多
个家庭单元;
步骤S120,分别对多个家庭单元进行资料采集,得到多组单元信息;
步骤S130,将多组单元信息录入到数据库,并将多组单元信息与数据库中的信息
进行对比和匹配,得到对比结果信息;
步骤S140,根据对比结果信息,将多组家庭单元进行关联组成多组父系亲属关系
网。
具体的,Y网以户(家庭)为切入点,由每户(家庭)中具有父系遗传关系(即来自同
一父系)的第一成员组构建成每个家庭单元,采集每名成员、不在本户的上代直系亲属和每
名成员亲兄弟的资料,借助数据库软件将采集的每个单元信息进行比对碰撞,以父系亲属
关系为连接线,横向关联信息重合的单元形成Y网,最后圈定关系网中被采集人员进行建
库。
根据本发明的示例性实施例,参照图2,单元信息包括户内信息和户外信息,上述
横向关联家系调查方法中步骤S120可采用重复执行以下处理,直至每个家庭单元都被遍
历:
步骤S210,选取第一成员组中首辈分成员,并以首辈分成员为基础向上延伸多代
直系亲属,得到第二成员组;
步骤S220,选取第一成员组的非本户亲兄弟成员,得到第三成员组;
步骤S230,对第一成员组进行资料采集,得到户内信息;
步骤S240,对第二成员组和第三成员组进行资料采集,得到户外信息。
具体的,以户(家庭)为采集对象,全区范围内采集登记每个家庭的男性成员的资
料,包含姓名、身份证号码等,当无法获取身份证号码时,可以采集配偶姓名信息,由每户
(家庭)中具有父系遗传关系(即来自同一父系)的第一成员组构成每个家庭单元。然后纵向
采集家庭单元中首辈分成员(即最高辈分成员)向上延伸的多代直系亲属的资料,横向登记
家庭单元中第一成员组的非本户亲兄弟成员的资料。因此,每个家庭单元的单元信息由户
内信息和户外信息两部分组成。另外,考虑到Y-STR基因座存在突变的情形,大规模的Y-STR
数据库应适当地增加采集密度,多代直系亲属可以为两代。
根据本发明的示例性实施例,参照图3,单元信息还包括身份信息和配偶姓名信
息,上述横向关联家系调查方法中步骤S130可采用如下步骤实现:
步骤S310,将多组身份信息与数据库中的信息进行对比,得到主要对比信息;
步骤S320,将多组配偶姓名信息与数据库中的信息进行对比,得到辅助对比信息;
步骤S330,根据辅助对比信息,对主要对比信息进行补充,得到对比结果信息。
具体的,通过网络将多组单元信息导入到具有统计、比对功能的数据库中,即多组
单元信息构成了数据库中的信息,将多组单元信息与数据库中的信息进行对比和匹配,就
是将多组单元信息之间进行对比和匹配;单元信息包括身份信息和配偶姓名信息,身份信
息为姓名和身份证号码,以姓名和身份证号码为主进行自动比对,得到主要对比信息,以配
偶姓名信息为辅进行自动对比,得到辅助对比信息,辅助对比信息对主要对比信息进行补
充,得到对比结果信息。
根据本发明的示例性实施例,参照图4,上述横向关联家系调查方法中步骤S140可
采用如下步骤实现:
步骤S410,判断对比结果信息是否匹配;
步骤S420,如果匹配,则将多组家庭单元进行统计并互相关联,组成多组父系亲属
关系网;
步骤S430,如果不匹配,则与其他多组单元信息再次进行对比和匹配,直到获取匹
配的家庭单元并互相关联,组成新的一组父系亲属关系网。
具体的,判断以上获得的对比结果信息是否为重复单元信息,并用来作为多组家
庭单元匹配与否的依据,即录入到数据库的多组家庭单元如有姓名和身份证号重复或者配
偶姓名信息出现的信息重叠情况,则判定为相对应的多组家庭单元之间具备匹配关系,由
计算机统计匹配的所有家庭单元,把相应的所有家庭单元相互关联组成同一个父系亲属关
系网,这样就实现了父系亲属关系调查的自动化,智能化。为方便理解,以下通过表1至表4
做详细描述。
表1
表2
表3
表4
其中,表1为第一家庭单元,表2为第二家庭单元,表3为第三家庭单元,表4为第四
家庭单元。
最后,在一个父系亲属关系网内选取多个成员作为代表进行Y-STR建库,网内单元
数较多时,可加密采集。被采集人相互之间血缘关系应尽可能远,尽可能选取比较庞大家庭
的人员,且年龄在15-45岁,而数据库盲比出现无容差或容差1个基因座时,需增加采样进行
验证。
实施例二:
图5为本发明实施例二提供的横向关联家系调查系统示意图。
参照图5,横向关联家系调查系统包括构建器100、采集器200、对比器300和Y网获
取器400;
构建器100,用于对每个家庭中具有父系遗传关系的第一成员组进行选取,从而构
建多个家庭单元;
采集器200,用于分别对多个家庭单元进行资料采集,得到多组单元信息;
对比器300,用于将多组单元信息录入到数据库,并将多组单元信息与数据库中的
信息进行对比和匹配,得到对比结果信息;
Y网获取器400,用于根据对比结果信息,将多组家庭单元进行关联组成多组父系
亲属关系网。
根据本发明的示例性实施例,单元信息包括户内信息和户外信息,采集器200包
括,重复执行以下处理,直至每个家庭单元都被遍历:
选取第一成员组中首辈分成员,并以首辈分成员为基础向上延伸多代直系亲属,
得到第二成员组;
选取第一成员组的非本户亲兄弟成员,得到第三成员组;
对第一成员组进行资料采集,得到户内信息;
对第二成员组和第三成员组进行资料采集,得到户外信息。
根据本发明的示例性实施例,单元信息还包括身份信息和配偶姓名信息,对比器
300包括:
将多组身份信息与数据库中的信息进行对比,得到主要对比信息;
将多组配偶姓名信息与数据库中的信息进行对比,得到辅助对比信息;
根据辅助对比信息,对主要对比信息进行补充,得到对比结果信息。
根据本发明的示例性实施例,Y网获取器400包括:
判断对比结果信息是否匹配;
如果匹配,则将多组家庭单元进行统计并互相关联,组成多组父系亲属关系网;
如果不匹配,则与其他多组单元信息再次进行对比和匹配,直到获取匹配的家庭
单元并互相关联,组成新的一组父系亲属关系网。
根据本发明的示例性实施例,多代直系亲属包括两代直系亲属。
本发明提供了横向关联家系调查系统,包括构建器、采集器、对比器和Y网获取器,
通过对每个家庭中具有父系遗传关系的第一成员组进行选取,从而构建多个家庭单元,分
别对多个家庭单元进行资料采集,得到多组单元信息,将多组单元信息录入到数据库,并将
多组单元信息与数据库中的信息进行对比和匹配,得到对比结果信息,根据对比结果信息,
将多组家庭单元进行关联组成多组父系亲属关系网。本发明可以提高建设家系图谱信息库
的高效性、完整性和准确性,并可以降低人力资源和成本。
本发明实施例所提供的横向关联家系调查方法及系统的计算机程序产品,包括存
储了程序代码的计算机可读存储介质,所述程序代码包括的指令可用于执行前面方法实施
例中所述的方法,具体实现可参见方法实施例,在此不再赘述。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统
和装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以
存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说
对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计
算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个
人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。
而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存
储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
在本发明的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、
“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了
便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、
以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”、
“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明
的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发
明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员
在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻
易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使
相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护
范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。