《基于词汇树层次语义模型的图像检索方法.pdf》由会员分享,可在线阅读,更多相关《基于词汇树层次语义模型的图像检索方法.pdf(15页完整版)》请在专利查询网上搜索。
1、(10)申请公布号 CN 103020111 A (43)申请公布日 2013.04.03 C N 1 0 3 0 2 0 1 1 1 A *CN103020111A* (21)申请号 201210422998.5 (22)申请日 2012.10.29 G06F 17/30(2006.01) (71)申请人苏州大学 地址 215123 江苏省苏州市苏州工业园区仁 爱路199号 (72)发明人吴健 崔志明 张月辉 李承超 (74)专利代理机构苏州创元专利商标事务所有 限公司 32103 代理人陶海锋 (54) 发明名称 基于词汇树层次语义模型的图像检索方法 (57) 摘要 本发明公开了一种图像检。
2、索方法,基于词汇 树层次语义模型实现。首先提取图像包含颜色信 息的SIFT特征来构造图像库的特征词汇树,生成 描述图像视觉信息的视觉词汇。并在此基础上利 用Bayesian决策理论实现视觉词汇到语义主题 信息的映射,进而构造了一个层次语义模型,并在 此模型基础上完成了基于内容的语义图像检索算 法。通过检索过程中用户的相关反馈,不仅可以加 入正反馈图像扩展图像查询库,同时能够修正高 层语义映射。实验结果表明,本发明的检索方法性 能稳定,并且随着反馈次数的增加,检索效果明显 提升。 (51)Int.Cl. 权利要求书2页 说明书7页 附图5页 (19)中华人民共和国国家知识产权局 (12)发明专利。
3、申请 权利要求书 2 页 说明书 7 页 附图 5 页 1/2页 2 1.一种基于词汇树层次语义模型的图像检索方法,提供用于检索的图像库和待检索的 图片,其特征在于,包括下列步骤: (1)提取图像库中所有图片的SIFT特征,得到特征集合; (2)构建词汇树,方法是:设定聚类个数K,树的深度P,对步骤(1)获得的特征集合进 行分层聚类,第一层获得K个聚类,作为词汇树的K个子节点,计算出每个子节点的中心向 量;对每个子节点分别进行聚类,每一子节点生成K个下一层的子节点,并计算出每个子节 点的中心向量;不断重复直到树的深度达到预设值P,获得SIFT词汇树;其中,K取510 的整数,P取36的整数; 。
4、(3)将图像库中的图片与词汇树进行关联:词汇树的叶节点个数为M=KP,每个叶节 点具有中心向量C m ,其中,m为1M的整数,将每个叶节点称为一个视觉词汇单词W m ,图像 库中的总图片数为N,其中每个图片称为一个文档F i ,i是1N的整数,则文档F i 和视觉 词汇单词W m 的相关度为Weight(i,m)=NUMi m idf m ,式中,NUMi m 表示视觉词汇单词W m 在图 片文档F i 中出现的次数,N m 表示视觉词汇单词W m 一共包含的图片文档数目; 计算每个图片与词汇树的每个叶节度的相关度,完成图片与词汇树的关联; (4)设定图像库的语义主题信息集,先采用人工标注的方。
5、法将图像库中的图片分类至 语义主题信息集中的各语义主题信息;再利用Bayesian统计决策理论实现视觉词汇层到 语义信息层的映射,映射方法为,每个视觉词汇单词和语义主题信息间的映射概率为: 式中,q n 表示当前语义主题信息,y m 表示当前视觉词 汇单词的中心向量,y i 表示第i个视觉词汇单词的中心向量,f(y i )是第i个视觉词汇单词 对应语义主题信息节点q n 的图片数目与总的图像库中图片数目N的比值,G(y m ,y i ,)是 Gaussian核函数,是平滑参数; (5)提取待查询图片的SIFT特征,得到具有n个特征点的特征向量 T=t 1 ,t 2 t n ; (6)将待查询图。
6、片的SIFT特征量化到SIFT词汇树的m个视觉词汇单词上,形成一个m 维的特征向量V=v 1 ,v 2 v m ,方法为: 将待查询图片提取到的SIFT特征点向量对词汇树逐层的节点进行欧氏距离计算,找 到每层上最相近的节点作为匹配节点;对提取到的n个特征点进行匹配操作,对于每一个 视觉词汇单词节点,累计待查询图片中特征点与该节点的匹配次数NUM m ,利用生成词汇树 时产生的视觉词汇单词节点的值idf m ,计算出待查询图片与视觉词汇单词节点的相关程度 w m ,最终形成一个m维的特征向量V=v 1 ,v 2 v m ,其中w i =v i ; (7)利用在视觉词汇层上量化后的特征向量V=v 。
7、1 ,v 2 v m ,与图像库中所有图片 在视觉词汇层上量化结果进行欧氏距离计算,和每张图片V=v 1 ,v 2 v n 得到一个 匹配值Wt 1 : (8)根据步骤(6)中计算得到的NUM m ,利用所建立的主题信息语义映射的Bayesian模 权 利 要 求 书CN 103020111 A 2/2页 3 型,计算得到主题语义信息集合对应的概率值集合q=q 1 ,q 2 q n ,式中,n是主题语义 信息的个数,q n 为待查询图片属于该主题语义信息的概率; (9)对于步骤(8)中生成的集合q=q 1 ,q 2 q n ,和图像库中每张图片的语义特征 q=q 1 ,q 2 q n 进行欧氏。
8、距离的计算,得到匹配值记为Wt 2 : (10)待查询图片与图像库中的每张图片的相似度定义为Weight=gWt 1 +Wt 2 ,式中,g 的取值范围是812,Weight的值越小,待查询图片与该图片越近似,检索结果排位越前, 由此实现图像的检索。 2.根据权利要求1所述的图像检索方法,其特征在于:根据用户搜索结果的反馈信息 修正语义映射并扩展图像库,方法为: 根据用户的查询图片返回查询结果,用户根据返回结果标记满意的结果为正反馈记 录I + ,其余为负反馈记录I - ; 将用户的查询图片加入到词汇树中,其量化到的每一个视觉词汇单词节点,都加入 该图片的记录,并且更新idf值。 根据步骤(4。
9、)的语义映射公式在视觉词汇层到主题语义信息层映射的过程中,对于 正反馈图像分布的每一个视觉词汇单词节点,其视觉词汇单词y上出现包含语义主题信息 节点q i 的图片数目占总图像库中数目的比值P(q i )都增加一个正比例因子U + ,而对于负反 馈图像分布的每一个视觉词汇单词节点,其P(q i )都加上一个负比例因子U - ,其中,U + =0.1, U - =-0.1。 3.根据权利要求1所述的图像检索方法,其特征在于:步骤(2)中,聚类的方法采用 K-means聚类法,聚类个数K取6,树的深度P取4。 4.根据权利要求1所述的图像检索方法,其特征在于:步骤(10)中,g的取值为10。 权 利。
10、 要 求 书CN 103020111 A 1/7页 4 基于词汇树层次语义模型的图像检索方法 技术领域 0001 本发明涉及一种图像检索的方法,具体涉及一种基于内容的图像检索方法,尤其 是一种考虑图像所包含的图像高层语义信息,并加入用户对图像内容理解和检索结果反馈 的方法。 背景技术 0002 随着因特网和多媒体技术的迅速发展,从20世纪90年代初至今,基于内容的图像 检索(CBIR)得到了广泛的研究。 0003 现有图像检索技术中,由于其使用图像纹理、颜色和形状等低层特征作为索引来 对图像进行检索,而图像低层特征表达出的信息与用户对这些特征图像理解的含义存在不 一致性,即语义鸿沟,所以检索效。
11、果往往不能满足用户的需求。 0004 如果检索过程中能够考虑图像所包含的图像高层语义信息,加入用户对图像内容 的理解,则会是一种更贴近用户理解的图像检索。然而,目前语义检索中语义映射关系大多 是通过人工标注建立,对于待检索图像中的语义信息难以获得较好的映射,并且,建立的映 射关系不能随着用户检索的反馈信息自动进行修正,从而影响检索效果的提升。 发明内容 0005 本发明的发明目的是提供一种基于词汇树层次语义模型的图像检索方法,利用词 汇树将图像特征与人工标注的语义特征进行关联,以实现检索过程中的自动语义映射;并 实现高层语义映射的自动修正,以获得更好的检索效果,更贴近检索用户的需求。 0006。
12、 为达到上述发明目的,本发明采用的技术方案是:一种图像检索方法,提供用于检 索的图像库和待检索的图片,包括下列步骤: 0007 (1)提取图像库中所有图片的SIFT特征,得到特征集合; 0008 (2)构建词汇树,方法是:设定聚类个数K,树的深度P,对步骤(1)获得的特征集 合进行分层聚类,第一层获得K个聚类,作为词汇树的K个子节点,计算出每个子节点的中 心向量;对每个子节点分别进行聚类,每一子节点生成K个下一层的子节点,并计算出每个 子节点的中心向量;不断重复直到树的深度达到预设值P,获得SIFT词汇树;其中,K取5 10的整数,P取36的整数; 0009 (3)将图像库中的图片与词汇树进行。
13、关联:词汇树的叶节点个数为M=KP,每个 叶节点具有中心向量C m ,其中,m为1M的整数,将每个叶节点称为一个视觉词汇单词W m , 图像库中的总图片数为N,其中每个图片称为一个文档F i ,i是1N的整数,则文档F i 和 视觉词汇单词W m 的相关度为Weight(i,m)=NUM im idf m ,式中,NUMi m 表示视觉词汇单词W m 在图片文档F i 中出现的次数,N m 表示视觉词汇单词W m 一共包含的图片文档数 目;计算每个图片与词汇树的每个叶节度的相关度,完成图片与词汇树的关联; 0010 (4)设定图像库的语义主题信息集,先采用人工标注的方法将图像库中的图片 说 明。
14、 书CN 103020111 A 2/7页 5 分类至语义主题信息集中的各语义主题信息;再利用Bayesian统计决策理论实现视觉词 汇层到语义信息层的映射,映射方法为,每个视觉词汇单词和语义主题信息间的映射概率 为: 0011 式中,q n 表示当前语义主题信息,y m 表示当 前视觉词汇单词的中心向量,y i 表示第i个视觉词汇单词的中心向量,f(y i )是第i个 视觉词汇单词对应语义主题信息节点q n 的图片数目与总的图像库中图片数目N的比 值,G(y m ,y i ,)是Gaussian核函数,是平滑参数;上述公式的获得过程推论如下: 式中,f Y (q i ,y)是视觉词汇单词节点。
15、的中心向量y相对于主题信 息节点q i 的条件概率密度,f Y (y)是中心向量y的视觉词汇单词上出现包含语义主题信息 节点q i 的图片数目与总的图像库中数目的比值,P(q i ,y)为视觉词汇单词M y 映射到语义主 题信息q i 的后验概率,P(q i )为语义主题信息的先验概率值,其中是语义主 题信息q i 包含的图片数,N是图像库中的总图片数;其中, G(y m ,y i ,)是Gaussian核函数,y i 是语义主题信息q i 对应的每一个视觉词汇的中心向量, y m 为当前视觉词汇的中心向量,是平滑参数;得后验概率公式。 0012 (5)提取待查询图片的SIFT特征,得到具有n。
16、个特征点的特征向量 T=t 1 ,t 2 t n ; 0013 (6)将待查询图片的SIFT特征量化到SIFT词汇树的m个视觉词汇单词上,形成一 个m维的特征向量V=v 1 ,v 2 v m ,方法为: 0014 将待查询图片提取到的SIFT特征点向量对词汇树逐层的节点进行欧氏距离计 算,找到每层上最相近的节点作为匹配节点;对提取到的n个特征点进行匹配操作,对于每 一个视觉词汇单词节点,累计待查询图片中特征点与该节点的匹配次数NUM m ,利用生成词 汇树时产生的视觉词汇单词节点的值idf m ,计算出待查询图片与视觉词汇单词节点的相关 程度w m ,最终形成一个m维的特征向量V=v 1 ,v。
17、 2 v m ; 0015 (7)利用在视觉词汇层上量化后的特征向量V=v 1 ,v 2 v m ,与图像库中所有 图片在视觉词汇层上量化结果进行欧氏距离计算,和每张图片V=v 1 ,v 2 v n 得到 一个匹配值Wt 1 : 0016 0017 (8)根据步骤(6)中计算得到的NUM m ,利用所建立的主题信息语义映射的 Bayesian模型,计算得到主题语义信息集合对应的概率值集合q=q 1 ,q 2 q n ,式中,n 是主题语义信息的个数,q n 为待查询图片属于该主题语义信息的概率; 0018 (9)对于步骤(8)中生成的集合q=q 1 ,q 2 q n ,和图像库中每张图片的语义。
18、 特征q=q 1 ,q 2 q n 进行欧氏距离的计算,得到匹配值记为Wt 2 : 0019 说 明 书CN 103020111 A 3/7页 6 0020 (10)待查询图片与图像库中的每张图片的相似度定义为Weight=gWt 1 +Wt 2 ,式 中,g表示调整Wt 1 与Wt 2 数量级的参数,g的取值范围是812;Weight的值载小,待查询 图片与该图片越近似,检索结果排位越前,由此实现图像的检索。 0021 进一步的技术方案,根据用户搜索结果的反馈信息修正语义映射并扩展图像库, 方法为: 0022 根据用户的查询图片返回查询结果,用户根据返回结果标记满意的结果为正反 馈记录I +。
19、 ,其余为负反馈记录I - ; 0023 将用户的查询图片加入到词汇树中,其量化到的每一个视觉词汇单词节点,都 加入该图片的记录,并且更新idf值。 0024 根据步骤(4)的语义映射公式在视觉词汇层到主题语义信息层映射的过程中, 对于正反馈图像分布的每一个视觉词汇单词节点,其视觉词汇单词y上出现包含语义主题 信息节点q i 的图片数目占总图像库中数目的比值P(q i )都增加一个正比例因子U + ,而对于 负反馈图像分布的每一个视觉词汇单词节点,其P(q i )都加上一个负比例因子U - 。 0025 优选的技术方案,步骤(2)中,聚类的方法采用K-means聚类法,聚类个数K取6, 树的深。
20、度P取4。步骤(10)中,g的取值为10。 0026 由于上述技术方案运用,本发明与现有技术相比具有下列优点: 0027 1、本发明引入了词汇树模型,和现有方法中直接使用低层特征和语义主题映射相 比,有更好的检索效果。 0028 2、本发明同时使用低层特征和语义主题映射进行检索,通过设定权重实现图像的 检索,检索结果更为有效。 0029 3、本发明通过进一步设置反馈过程,利用用户提供的正反馈图像和负反馈图像, 不仅可以自动扩展含有高层语义信息的查询图像库,而且使得建立的基于词汇树层次语义 模型通过修正视觉词汇到主题信息的映射关系,使图像的语义信息提取更加准确,随着用 户查询次数的增加,视觉词汇。
21、到主题信息的映射会越加完善,检索效果更加精确。 附图说明 0030 图1是实施例中构建SIFT词汇树的示意图。 0031 图2是实施例中作为待检索图片的汽车样例图。 0032 图3是汽车图片作为检索例,图片库中80张图片第一次检索结果图。 0033 图4是一次用户反馈后,图片库中80张图片的检索结果图。 0034 图5是图片库中10类图片,随着用户反馈次数的增加,检索效果的变化情况图。 0035 图6是整个技术方案流程图。 具体实施方式 0036 下面结合附图及实施例对本发明作进一步描述: 0037 实施例:一种基于词汇树层次语义模型的图像检索方法。首先提取图像包含颜色 信息的SIFT特征来构。
22、造图像库的特征词汇树,生成描述图像视觉信息的视觉词汇。并在此 基础上利用Bayesian决策理论实现视觉词汇到语义主题信息的映射,进而构造了一个层 次语义模型,并在此模型基础上完成了基于内容的语义图像检索算法。通过检索过程中用 说 明 书CN 103020111 A 4/7页 7 户的相关反馈,不仅可以加入正反馈图像扩展图像查询库,同时能够修正高层语义映射。实 验结果表明,基于该模型的图像检索算法性能稳定,并且随着反馈次数的增加,检索效果明 显提升。 0038 整个方法过程按如下步骤处理: 0039 (1)首先对图像库构建视觉词汇树,并将图片量化到词汇树; 0040 (1.1)首先提取图像库中。
23、所有图片的SIFT特征,得到一个特征集合 Feature=feature i ,然后对特征集合Feature=feature i 进行分层聚类,此处我们采用 K-Means聚类方法,因为它有比较好的伸缩性,聚类速度相对较快。聚类结果生成K个子节 点(本例中K取6),计算出每个子节点的中心向量C i ,同样地,对新生成的每个子节点再 进行K-Means聚类,以生成下一层的子节点,不断重复直到树的深度达到预设值P(本例中 P=4)。这样最终会构造出一个完整的SIFT词汇树,过程如图1所示。 0041 (1.2)通过构造词汇树,就生成了1296个聚类簇集(选取最后一层簇集),且每个 聚类簇集都有一个。
24、中心向量C m ,把生成的聚类簇集称作视觉词汇单词,图像库中的每幅图 片称为一个文档,通过计算每个文档和词汇单词的相关程度使图像量化到这1296个聚类 簇集中,即生成一个1296维的向量。假设F i 表示每个图片文档,W m 表示每个词汇单词, Weight(i,m)表示文档和词汇单词的相关度。所有每个文档就可以量化到M个视觉词汇单 词中,在计算Weight(i,m)时,NUMi m 表示单词W m 在图片文档F i 中出现的次数。N m 表示词 汇单词W m 一共包含的图片文档数目,最终图片文档F i 和视觉词汇单词W m 的相 关度为Weight(i,m)=NUMi m idf m 。 0。
25、042 (2)视觉词汇层到语义信息层的映射 0043 Bayesian理论主要是在获得先验类属概率的前提下,通过对后验概率函数的计 算进行分类,计算公式:将其应用到本方法中,可以实现从视觉词 汇层到语义信息层的映射。其中,f Y (q i ,y)是视觉词汇单词节点的中心向量y相对于主 题信息节点q i 的条件概率密度,f(y)是中心向量y的视觉词汇单词上出现包含语义主题 信息节点q i 的图片数目与总的图像库中数目的比值,P(q i ,y)为视觉词汇单词M y 映射到 语义主题信息q i 的后验概率,P(q i )为语义主题信息的先验概率值,其中 是语义主题信息q i 包含的图片数,N是图像库。
26、中的总图片数; 其中,G(y,y i ,)是Gaussian核函数,y i 是语义主题信息q i 对应的每一个视觉词 汇的中心向量,y为当前视觉词汇的中心向量,是平滑参数;得后验概率公式为: 这样利用Bayesian统计决策理论实现了视觉词汇层到语义 信息层的映射,从而实现了图像的高层语义信息提取,并且在此基础上可以进行语义图像 检索。 0044 (3)对待查询图片提取包含颜色信息的SIFT特征,得到具有n(各图片有不同特征 说 明 书CN 103020111 A 5/7页 8 点数不同)个特征点的特征向量T=t 1 ,t 2 t n ; 0045 (4)将查询图片的SIFT特征量化到SIFT。
27、词汇树的1296个视觉词汇单词上,形成 一个1296维的特征向量V=v 1 ,v 2 ,v 1296 ,具体方法为: 0046 对查询图片提取到的SIFT特征点向量对词汇树逐层的节点进行欧氏距离计算, 找到每层上最相近的节点作为匹配节点。对提取到的n个特征点进行相同操作,最终对于 每一个视觉词汇单词节点,累计查询图片中特征点与该节点的匹配次数NUM m 。利用生成词 汇树时产生的视觉词汇单词节点的值idf m ,就可以计算出查询图片与视觉词汇单词节点的 相关程度w m 。最终形成一个m维的特征向量V=v 1 ,v 2 v m 。 0047 (5)利用在视觉词汇层上量化后的特征向量V=v 1 ,。
28、v 2 v m ,对图像 库中所有图片在视觉词汇层上量化结果进行欧式距离计算,这样就会和每张图片 V=v 1 ,v 2 v n 得到一个匹配值Wt 1 。 0048 0049 (6)根据(4)步骤中计算得到的NUM m ,利用所建立的主题信息语义映射的 Bayesian模型,按照式计算得到主题语义信息集合对应的概 率值集合q=q 1 ,q 2 q n 。 0050 (7)对于步骤(6)中生成的集合q=q 1 ,q 2 q n 。图像库中图片如果包含主题 信息Q i ,和图像库中每张图片的语义特征q=q 1 ,q 2 q n 进行欧氏距离的计算,得 到匹配值记为Wt 2 。 0051 0052 。
29、(8)最终图像库中的图片IMG j 和查询图片的相似度定义为Weight=gWt 1 +Wt 2 ,该 值越小,在检索结果中越靠前。 0053 (9)相关反馈 0054 在上述基于词汇树的语义模型下进行图像检索时,视觉词汇层到主题语义信息层 的映射对检索效果有很重要的影响。所以在检索过程中,可以根据用户搜索结果的反馈信 息修正语义映射使其更加完善,并且可以加入正反馈图像来扩展图像库,因此避免了人工 标注图像语义信息来增加查询图像库的困难。 0055 具体过程为: 0056 根据用户的查询图片返回查询结果,用户根据返回结果标记满意的结果为正反 馈记录I + ,其余为负反馈记录I - 。 0057。
30、 将用户的查询图片加入到词汇树中,其量化到的每一个视觉词汇单词节点,都 加入该图片的记录,并且更新idf值。 0058 根据语义映射公式在视觉词汇层到主题语义信 息层映射的过程中,对于正反馈图像分布的每一个视觉词汇单词节点,其视觉词汇单词y 上出现包含语义主题信息节点q i 的图片数目占总图像库中数目的比值f(y i )都增加一个正 说 明 书CN 103020111 A 6/7页 9 比例因子U + ,而对于负反馈图像分布的每一个视觉词汇单词节点,其f(y i )都加上一个负比 例因子U - 。其中,U + =0.1,U - =-0.1。 0059 这样在反馈过程中,通过用户提供正反馈图像和。
31、负反馈图像,不仅可以自动扩展 含有高层语义信息的查询图像库,而且使得建立的基于词汇树层次语义模型通过修正视觉 词汇到主题信息的映射关系,使图像的语义信息提取更加准确,随着用户查询次数的增加, 视觉词汇到主题信息的映射会越加完善,检索效果更加精确。 0060 图片库分10类,每类图片有100幅相同语义的图像,所以我们在检索过程中统计 前80幅图像的查询结果。以附图2(汽车)所示图片为用户检索图片例作进一步说明,分 别按如下步骤处理: 0061 1首先构建图片库的词汇树,得到1296个簇集,即1296个视觉词汇,记录每个结 点的idf m (1m1296)值的数据。 0062 2利用上述的Baye。
32、sian统计学习模型将1296个视觉单词映射到汽车主题,计算 相对应的概率值。 0063 3提取汽车图片包含颜色信息的SIFT特征,得到具有27(对于本张汽车图片特 征点数为27)个特征点的特征向量Y=y 1 ,y 2 ,y 27 。 0064 4将汽车图片的SIFT特征量化到SIFT词汇树的1296个视觉词汇单词上,形成 一个1296维的特征向量V=v 1 ,v 2 ,v 1296 。具体处理过程为: 0065 4.1对汽车图片提取到的SIFT特征点向量对词汇树逐层的节点进行欧氏距离 计算,找到每层上最相近的节点作为匹配节点。对提取到的n(n=27)个特征点进行相同操 作,最终对于每一个视觉。
33、词汇单词节点,累计查询图片中特征点与该节点的匹配次数NUM m 。 0066 4.2利用生成词汇树时产生的视觉词汇单词节点的值idf m ,就可以计算出查 询图片与视觉词汇单词节点的相关程度v i (1im),最终形成一个m维的特征向量 V=v 1 ,v 2 v m 。 0067 5利用在视觉词汇层上量化后的特征向量V=v 1 ,v 2 v m ,对图像库中所有 图片在视觉词汇层上量化结果进行匹配,这样就会和每张图片得到一个匹配值Wt 1 。 0068 6根据4步骤中计算得到的NUM m ,利用所建立的主题信息语义映射的 Bayesian模型,按照公式计算得到主题语义信息集合对应的 概率值集合。
34、q=q 1 ,q 2 q n (1n10)。本例中10类图片中各类主题语义信息集合 对应的概率值如下: 0069 q q 1 野人 q 2 海滩 q 3 高楼 q 4 汽车 q 5 恐龙 71.823296 34.826923 69.850754 84.297997 18.006845 q q 6 大象 q 7 鲜花 q 8 野马 q 9 雪山 q 10 美食 34.693035 9.772268 34.730274 35.102665 60.221863 说 明 书CN 103020111 A 7/7页 10 0070 7对于步骤6中生成的集合q=q 1 ,q 2 q n 。图像库中图片如果。
35、包含主题 信息Q i ,则该图片和查询图片的语义相关度就等于主题信息Q i 在q=q 1 ,q 2 q n 中的概 率值,记为Wt 2 。 0071 8计算图像库中的1000张图片IMG j 和查询图片的相似度Weight,在本例实际 处理时,Weight=10Wt 1 +Wt 2 。 0072 Weight值越小,则图片显示位置越靠前,附图3中给出了前80张图片的检索结果 图。 0073 9相关反馈 0074 根据附图3中80张图片的检索结果,选择第2张图片为正反馈图像,第31(或32) 张图片为负反馈图像,进行反馈查询。 0075 修改视觉词汇单词到汽车主题语义信息的映射概率值。 0076。
36、 反馈查询结果见附图4,从附图4中可以看出,负反馈图像位置后移,整个检索效 果更优,可进一步反馈以得到更好的检索结果。 0077 附图5给出了在每个语义类别中,随着用户反馈次数的增加,检索效果的变化情 况。其表明在基于词汇树层次语义模型的图像检索系统中,用户的相关反馈对于检索结果 提升有很好的作用。并且随着用户反馈次数的增加,检索出来的相关图像会越多,效果越 好。 说 明 书CN 103020111 A 10 1/5页 11 图 1 图 2 说 明 书 附 图CN 103020111 A 11 2/5页 12 图 3 说 明 书 附 图CN 103020111 A 12 3/5页 13 图 4 说 明 书 附 图CN 103020111 A 13 4/5页 14 图 5 说 明 书 附 图CN 103020111 A 14 5/5页 15 图 6 说 明 书 附 图CN 103020111 A 15 。