《多模式场景中的三维对象的识别和姿势确定.pdf》由会员分享,可在线阅读,更多相关《多模式场景中的三维对象的识别和姿势确定.pdf(19页完整版)》请在专利查询网上搜索。
1、(10)申请公布号 CN 103729643 A (43)申请公布日 2014.04.16 CN 103729643 A (21)申请号 201310418597.7 (22)申请日 2013.09.13 12188290.6 2012.10.12 EP G06K 9/62(2006.01) G06T 7/00(2006.01) (71)申请人 MV 科技软件有限责任公司 地址 德国慕尼黑 (72)发明人 伯特伦德罗斯特 马库斯乌尔里希 (74)专利代理机构 北京同达信恒知识产权代理 有限公司 11291 代理人 黄志华 (54) 发明名称 多模式场景中的三维对象的识别和姿势确定 (57) 摘。
2、要 本发明提供了一种用于利用 3D 场景数据和 场景强度数据识别 3D 对象的实体和确定所述实 体的3D姿势的方法, 所述方法包括以下步骤 :(a) 提供 3D 对象数据并获得对象强度数据 ;(b)提 供 3D 场景数据和场景强度数据 ;(c) 从所述强度 数据中提取场景特征点 ;(d)从所述 3D 场景数 据中选择至少一个参考点 ;(e) 在假设所述参考 点为所述 3D 对象的一部分时, 针对每个所选的参 考点, 通过最大化所提取的场景特征点的数量而 为所述 3D 对象计算候选姿势, 在给定的候选姿势 下, 所述所提取的场景特征点与所述 3D 对象一 致 ;(f) 从所述候选姿势中计算一组过。
3、滤姿势。 (30)优先权数据 (51)Int.Cl. 权利要求书 3 页 说明书 12 页 附图 3 页 (19)中华人民共和国国家知识产权局 (12)发明专利申请 权利要求书3页 说明书12页 附图3页 (10)申请公布号 CN 103729643 A CN 103729643 A 1/3 页 2 1. 一种用于利用 3D 场景数据和场景强度数据识别 3D 对象的实体和确定所述实体的 3D 姿势的方法, 所述方法包括以下步骤 : a) 提供 3D 对象数据并获得对象强度数据 ; b) 提供 3D 场景数据和场景强度数据 ; c) 从所述强度数据中提取场景特征点 ; d) 从所述 3D 场景数。
4、据中选择至少一个参考点 ; e) 在假设所述参考点为所述 3D 对象的一部分的情况下, 针对每个所选的参考点, 通过 最大化所提取的场景特征点的数量而为所述 3D 对象计算候选姿势, 在给定的候选姿势下, 所述所提取的场景特征点与所述 3D 对象一致 ; f) 从所述候选姿势中计算一组过滤姿势。 2. 如权利要求 1 所述的方法, 其中, 在步骤 a) 中, 通过从所述 3D 对象数据合成地创建 强度数据来获得所述对象强度数据。 3. 如权利要求 1 所述的方法, 其中, 在步骤 a) 中, 提供所述对象强度数据。 4. 如权利要求 1 所述的方法, 其中, 步骤 a) 包括从所述 3D 对象。
5、数据和对象强度数据计 算模型。 5. 如权利要求 4 所述的方法, 其中, 步骤 a) 包括 : a1) 从所述 3D 对象数据中选择至少一个样本点 ; a2) 从所述对象强度数据中提取对象特征点 ; a3) 针对每对所选的样本点和所提取的对象特征点, 计算描述这两个点及这两个点的 关系的点对描述符 ; a4) 创建存储利用所述点对描述符来索引的点对的模型。 6. 如权利要求 5 所述的方法, 其中, 步骤 a4) 包括 : a4a) 采样所述点对描述符 ; a4b) 创建全局模型描述, 所述全局模型描述将每个采样的点对描述符映射到点对的一 列表, 其中, 每列表包含具有类似的采样的点对描述符。
6、的所有对所选的样本点和所提取的 对象特征点。 7. 如权利要求 1 至 6 中任一项所述的方法, 其中, 在步骤 d) 中, 从所述 3D 场景数据中 随机地选择所述参考点, 或者通过均匀地采样所述 3D 场景数据来选择所述参考点。 8. 如权利要求 1 至 7 中任一项所述的方法, 其中, 在步骤 e) 中, 为每个候选姿势计算分 数值。 9. 如权利要求 8 所述的方法, 其中, 使用决策方案计算所述候选姿势。 10. 如权利要求 9 所述的方法, 其中, 所述决策方案包括以下步骤 : e1) 采样可能的对象姿势的空间 ; e2) 针对每个姿势空间样本, 创建计数器 ; e3) 从所述所提。
7、取的场景特征点中选择至少一个场景特征点 ; e4) 针对每个所选的场景特征点, 计算匹配姿势, 使得所述参考点位于所述 3D 对象的 表面上且所述场景特征点与所述 3D 对象一致 ; e5) 针对在步骤 e4) 中所计算的每个匹配姿势, 增大相应的姿势空间样本的计数器 ; e6) 检测采样的姿势空间中的达到峰值的计数器值, 并选择相应的姿势空间样本作为 权 利 要 求 书 CN 103729643 A 2 2/3 页 3 候选姿势。 11. 如权利要求 10 所述的方法, 其中, 在步骤 e1) 中, 利用两个参数表示可能的对象姿 势的空间, 其中, 第一个参数为所述 3D 对象上的点, 第二。
8、个参数为角度。 12.如权利要求11所述的方法, 其中, 将所述3D对象上的点表示成到从所述3D对象数 据中所选的一组点的索引, 通过将一组角度分成等大小的间隔来采样所述角度。 13.如权利要求10所述的方法, 其中, 在步骤a) 中, 从所述对象强度数据中提取对象特 征点。 14.如权利要求13所述的方法, 其中, 在步骤e4) 中, 使用数据结构计算所述匹配姿势, 所述数据结构允许搜索类似于所述参考点与所述所选的场景特征点的对的 3D 对象点与对 象特征点的对。 15. 如权利要求 14 所述的方法, 其中, 搜索类似的点对的步骤包括以下步骤 : e4a) 计算描述所述参考点、 所述所选的。
9、场景特征点及所述参考点和所述所选的场景特 征点的关系的点对描述符 ; e4b) 将所述点对描述符用作到所述数据结构的索引。 16. 如权利要求 15 所述的方法, 其中, 步骤 e4b) 包括 : e4c) 采样所述点对描述符 ; e4d) 使用数据结构, 所述数据结构将采样的点对描述符映射到 3D 对象点与对象特征 点的对的列表。 17. 如权利要求 16 所述的方法, 其中, 在步骤 e4d) 中, 将哈希表用作为数据结构。 18. 如权利要求 9 至 17 中任一项所述的方法, 其中, 步骤 f) 中的计算包括 : f1) 定义所述候选姿势之间的相邻关系 ; f2) 按照相邻的候选姿势的。
10、分数的加权和计算每个姿势的分数 ; f3) 通过按照在 f2) 中所计算的分数把所述姿势分等级而选择所述一组过滤姿势。 19. 如权利要求 18 所述的方法, 其中, 通过取所述姿势的平移和所述姿势的旋转的差 值的阈值或者通过取所述 3D 对象上的点在两种姿势下能够具有的最大距离的阈值来定义 所述相邻关系。 20. 如权利要求 18 所述的方法, 还包括以下步骤 : 按照所述相邻姿势上的平均姿势再 计算 f3) 中所选的姿势。 21. 如权利要求 1 至 20 中任一项所述的方法, 还包括以下步骤 : 通过优化基于所述姿 势下的所述3D场景与所述3D对象之间的距离的误差函数而细化所述一组过滤姿。
11、势中的每 个姿势。 22. 如权利要求 1 至 20 中任一项所述的方法, 还包括以下步骤 : 通过优化基于所述姿 势下的所述场景强度数据与所述模型强度数据的一致性的误差函数而细化所述一组过滤 姿势中的每个姿势。 23. 如权利要求 1 至 20 中任一项所述的方法, 还包括以下步骤 : 通过优化基于所述姿 势下的所述3D场景与所述3D对象之间的距离和所述场景强度数据与所述模型强度数据的 一致性的误差函数而细化所述一组过滤姿势中的每个姿势。 24. 如权利要求 1 至 23 中任一项所述的方法, 其中, 在步骤 c) 中, 将边缘点用作场景特 征点。 权 利 要 求 书 CN 10372964。
12、3 A 3 3/3 页 4 25. 如权利要求 24 所述的方法, 还包括步骤 c1) : 使用所述 3D 场景数据进一步过滤所 述边缘点。 权 利 要 求 书 CN 103729643 A 4 1/12 页 5 多模式场景中的三维对象的识别和姿势确定 技术领域 0001 本发明总体涉及机器视觉系统, 尤其涉及利用成像和三维 (3D) 传感器所观测的场 景中的 3D 对象的识别和定位。 背景技术 0002 对象识别和定位是许多机器视觉应用的一部分。 知道场景中所关注的对象的精确 位置对任何后续操作和检查任务来说是至关重要的。 开发了许多不同的技术以查找场景的 强度图像或 3D 扫描图中的对象,。
13、 该任务通常被称为匹配。本申请描述一种同时使用场景的 强度图像和 3D 扫描图的匹配方法, 以通过采用 3D 数据和强度数据优化模型与场景的一致 性来查找对象。 0003 基于描述符或特征的技术建立在通过使用描述符来查找场景中的点与模型 上的点之间的对应关系的基础上。这种描述符使用低维表示来表示在给定的场景点 周围的 3D 表面或强度。通常, 对于模型的点的全部或者选定的一组脱机计算这种描 述符, 并将其存储在数据库中。为了识别场景中的对象, 对于场景中的点计算描述符, 并使用预先计算的数据库搜索相应的模型点。一旦发现足够的对应, 则可以还原对象 的 姿 势。Campbell 和 Flynn(。
14、A Survey Of Free-Form Object Representation and Recognition Techniques, 2001, Computer Vision and Image Understanding, 第 81 卷, 第 2 期, 第 166-210 页) 、 Mamic 和 Bennamoun(Representation and recognition of3D free-form objects, 2002, Digital Signal Processing, 第 12 卷, 第 1 期, 第 47-76 页) 以及 Mian 等 (Automati。
15、c Correspondence for3D Modeling:An Extensive Review, 2005, International Journal of Shape Modeling, 第 11 卷, 第 2 期, 第 253 页) 给出了 不同的 3D 表面描述符的广泛概述。强度数据中常用的特征描述符包括边缘, 如 Canny(A Computational Approach To Edge Detection, IEEE Transactions on Pattern Analysis and Machine Intelligence,8(6):679-698, 1986) 。
16、所描述的, SIFT 关键点描述符, 如 Lowe (Object recognition from local scale-invariant features, Proceedings of the International Conference on Computer Vision.2. 第 1150-1157 页 ; 也可参见专利号 为 6,711,293 的美国专利) 所描述的, 以及 SURF 关键描述符, 如 Bay 等 (SURF:Speeded Up Robust Features, Computer Vision and Image Understanding(CVIU)。
17、,2008, 第 110 卷 , 第 3 号 , 第 346-359 页 ; 也可参见专利号为 8,165,401 的美国专利) 所描述的。在文献中 提出了许多其它特征点描述符。如果所关注的对象具有小的独特形状或强度信息, 则依赖 于特征描述符的方法经常不起作用, 这是因为那样的话描述符是难以区别的。 0004 一些方法使用所谓的几何图元来检测场景中的对象。几何图元为简单的几何对 象, 例如平面、 柱面或球体。相比于自由形态的对象, 几何图元由于其内在对称性而在场 景中更易于被检测到。存在检测场景中的由几何图元组成的图元或对象的多种方法。在 EP-A-2 047 403 中, 将 3D 对象划。
18、分成几何图元。然后在 3D 场景中搜索这些几何图元, 并 且通过确定场景中的与对象中的图元相似的图元而识别对象。 其它方法使用广义霍夫变换 说 明 书 CN 103729643 A 5 2/12 页 6 的变型来检测场景中的几何图元, 例如 Katsoulas(Robust extraction of vertices in range images by constraining the hough transform, 2003, Lecture Notes in Computer Science,第2652卷,第360-369页) 、 Rabbani和Heuvel (Efficient 。
19、hough transform for automatic detection of cylinders in point clouds, 2005, Proceedings of the11th Annual Conference of the Advanced School for Computing and Imaging(ASCI05),第 60-65 页) 、 以及 Zaharia 和 Preteux(Hough transform-based3D mesh retrieval, 2001, Proceedings of the SPIE Conf.4476on Vision Geo。
20、metry X, 第 175-185 页) 。依赖于几 何图元的所有方法都具有的缺点是这些方法对一般的自由形态的对象不起作用。 0005 开发了用于识别距离图像中的3D对象的多种方法, 例如在EP-A-l 986 153中。 这 些方法对单距离图像起作用, 如各种传感器系统所返回的。 然而, 所有的基于距离图像的系 统都限于从单距离图像所获得的 3D 信息, 且不能处理来自其它 3D 传感器的通用 3D 信息或 来自不同的距离图像的组合的通用 3D 信息。此外, 对于实时系统来说, 这些方法并不足够 快速, 因为这些方法通常需要在参数空间中进行强力搜索。 0006 已知用于细化已知的对象的 3。
21、D 姿势的多种方法。这些方法需要将场景中的对象 的近似的3D姿势作为输入, 并且提高该姿势的精确度。 开发仅使用3D数据优化姿势的这几 种方法, 例如迭代最近点 (例如参见 Zhang (Iterative point matching for registration of free-form curves, 1994, International Journal of Computer Vision, 第 7 卷, 第 3 期, 第 119-152 页) 、 EP-A-2 026 279 以及 Fitzgibbon(Robust registration of2D and3D point 。
22、sets, 2003, Image and Vision Computing, 第 21 卷 , 第 13-14 期 , 第 1145-1153 页) 。其它用于细化对象的姿势的方法仅使用强度数据, 例如 Wiedemann 等 (Recognition and Tracking of3D Objects, IEEE International Conference on Robotics and Automation2009,1191-1198) 。 姿势细化的主要缺点是输入姿势需要足够接近正确姿势, 否 则这些方法将无法会聚。然而, 对于在实际应用中经常包含杂波、 闭塞、 噪声和多个对象实。
23、 例的 3D 场景来说, 难以获得正确姿势的良好近似。 0007 出于以上原因, 需要一种允许在场景中高效识别任意的自由形态的 3D 对象且还 原其 3D 姿势的方法, 利用一个或多个强度图像和一个或多个 3D 传感器捕获场景。为了本 文件的目的, 利用强度图像和 3D 传感器所捕获的场景也将被称为多模式场景。 发明内容 0008 本发明提供用于发现多模式场景中的刚性 3D 对象和利用场景坐标确定对象的 3D 姿势的系统和方法。 在典型应用中, 例如使用具有两个或更多个相机的立体声系统、 飞行时 间、 聚焦深度测量、 光度立体法或结构光来获得多模式场景。然后, 使用所提出的方法得到 对象的 3。
24、D 姿势。例如, 形成的 3D 姿势用于利用机器人操纵对象, 检测对象表面上的错误, 或者计算对象的表面特性。 0009 本方法比之前的方法具有如下几个优势 : 允许识别具有任何类型的表面几何形状 的自由形态的对象, 因此不限于特定类型或形状的对象。此外, 该方法对于噪声、 丢失的对 象部分、 杂波和小的变形是稳健的。高精度地确定 3D 对象的姿势。3D 对象的发现及其 3D 姿势的还原需要很少的计算时间, 适合于实时环境。 0010 本方法包括两个阶段。 在脱机阶段中, 计算模型描述, 模型描述后续可以用于发现 说 明 书 CN 103729643 A 6 3/12 页 7 对象。用户需要提。
25、供待发现的对象的 3D 表示, 例如 3D 的 CAD 模型或一组 3D 点, 以及可选 地, 来自各种视点的对象的图像。 如果未提供图像, 则从对象的3D表示人为地渲染图像。 因 此, 本方法仅需要对象的几何形状。不需要颜色、 纹理或表面反射率信息, 从而使本发明适 合于大范围的对象类型。然而, 可以提供额外的局部信息, 例如颜色和纹理, 以使用其它强 度特征, 因此, 进一步提高本方法的稳健性。通过以一定速率采样对象的表面、 从不同视点 的对象的强度图像中计算特征点和特征点描述符、 可选地使用 3D 表示过滤特征点、 将每个 采样的 3D 点与每个特征点组成一对、 计算描述每个这样的对的描。
26、述符、 以及将这些点对存 储在利用所述点对描述符来索引的数据库中而构建模型描述。 0011 在联机阶段中, 用户提供包括一组强度图像和一组 3D 场景的多模式场景和在脱 机阶段中所计算的模型描述。图像和场景必须相对彼此校准, 即必须提前知道内在传感器 参数及其相对位置。针对每个强度图像, 提取特征点, 计算特征点描述符, 可选地使用所提 供的 3D 数据过滤特征点描述符。通常, 将边缘用作特征点, 将边缘的方向作为特征描述符。 3D 数据用于去除纹理边缘, 因此仅获得几何边缘。然后以一定速率采样 3D 场景, 将那些点 的子集用作参考点。针对每个参考点, 相对于该参考点参数化对象的 3D 姿势。
27、。将采样的 3D 点与所提取的特征点组成一对, 并且为每个这样的对计算描述符。在脱机阶段中所计算的 数据库用于从模型中发现与场景中的点对相似的点对。将匹配体分组, 使用具有最多匹配 体的 3D 姿势。这同时优化了 3D 表面重叠和强度特征的一致性。作为可选的后处理步骤, 可以进一步细化所还原的姿势。 0012 根据第一方面, 本发明提供一种利用 3D 场景数据和场景强度数据识别 3D 对象的 实体和确定所述实体的 3D 姿势的方法, 所述方法包括以下步骤 :(a) 提供 3D 对象数据并获 得对象强度数据 ;(b) 提供 3D 场景数据和场景强度数据 ;(c) 从所述强度数据中提取场景 特征点。
28、 ;(d) 从所述 3D 场景数据中选择至少一个参考点 ;(e) 在假设所述参考点为所述 3D 对象的一部分的情况下, 针对每个所选的参考点, 通过最大化所提取的场景特征点的数量 而为所述3D对象计算候选姿势, 在给定的候选姿势下, 所提取的场景特征点与所述3D对象 一致 ;(f) 从所述候选姿势中计算一组过滤的姿势。优选地, 步骤 (a) 中的 3D 对象数据和 步骤 (b) 中的 3D 场景数据被提供为一组 3D 点或为 3D 计算机辅助设计模型。优选地, 步骤 (a) 和步骤 (b) 中的强度数据被提供为灰度图像或彩色图像。可替选地, 可通过人工地渲染 3D 场景数据或 3D 对象数据来。
29、创建强度数据。 0013 优选地, 在步骤 (a) 之后, 从 3D 对象计算 3D 模型, 包括以下步骤 :(a1) 从所述 3D 对象数据中选择至少一个样本点 ;(a2) 从所述对象强度数据中提取对象特征点 ;(a3) 针 对每对所选的样本点和所提取的对象特征点, 计算描述这两个点及其关系的点对描述符 ; (a4) 创建存储利用所述点对描述符来索引的点对的模型。优选地, 步骤 (a4) 包括 :(a4a) 采样所述点对描述符 ;(a4b) 创建全局模型描述, 所述全局模型描述将每个采样的点对描 述符映射到点对的列表, 其中, 每个列表包含具有类似的采样的点对描述符的所有对所选 的样本点和所。
30、提取的对象特征点。优选地, 从 3D 数据中随机地选择步骤 (a1) 中的样本点, 或者通过均匀地采样 3D 数据来选择步骤 (a1) 中的样本点。优选地, 在步骤 (a2) 中所提取 的对象特征点为利用边缘检测器所计算的边缘点, 且优选地, 使用 3D 对象数据过滤这些对 象特征点以仅获得对象的轮廓边缘。优选地, 步骤 (a4b) 中所创建的全局模型使用哈希表, 利用点对描述符的采样形式索引哈希表。 说 明 书 CN 103729643 A 7 4/12 页 8 0014 优选地, 在进行处理之前, 过滤 3D 对象数据、 3D 场景数据、 对象强度数据和场景强 度数据, 所述处理包括以下步。
31、骤中的至少一个 : 检测和去除异常值 ; 减少噪声 ; 以及针对 3D 数据, 计算表面法线。 0015 优选地, 点对描述符描述按照对象特征点的距离而缩放的特征向量, 特征向量描 述样本点与所提取的对象特征点在强度数据的图像平面内的距离, 以及点对描述符描述边 缘的相对取向、 表面点法线和两点间的差向量。 根据另一优选实施方式, 点对描述符额外地 包含以下可选的特征 : 为特征点计算的特征点描述符 ; 每点处的颜色值或灰度值 ; 每点处 的纹理信息 ; 每点处的表面描述符 ; 每点处的曲率 ; 每点处的其它几何表面信息。 0016 根据另一优选实施方式, 在步骤 (d) 中, 从所述 3D 。
32、场景数据中随机地选择所述参 考点, 或者通过均匀地采样所述 3D 场景数据来选择所述参考点。优选地, 相对于 3D 对象的 尺寸计算用于均匀采样 3D 场景数据的采样距离。 0017 更优选地, 在步骤 (e) 中, 为每个候选姿势计算分数值。优选地, 使用决策方案计 算所述候选姿势。优选地, 所述决策方案包括以下步骤 :(e1) 采样可能的对象姿势的空间 ; (e2) 针对每个姿势空间样本, 创建计数器 ;(e3) 从所提取的场景特征点中选择至少一个场 景特征点 ;(e4) 针对每个所选的场景特征点, 计算匹配姿势, 使得所述参考点位于所述 3D 对象的表面上且所述场景特征点与所述 3D 对。
33、象一致 ;(e5) 针对在步骤 (e4) 中所计算的每 个匹配姿势, 增大相应的姿势空间样本的计数器 ; 以及 (e6) 检测采样的姿势空间中的达到 峰值的计数器值, 并选择相应的姿势空间样本作为候选姿势。优选地, 在步骤 (e6) 中, 达到 峰值的计数器值的检测限于超过阈值的计数器值。优选地, 在步骤 (e1) 中, 利用两个参数 表示可能的对象姿势的空间, 其中, 第一个参数为所述 3D 对象上的点, 第二个参数为描述 围绕表面法线的旋转的角度。优选地, 将所述 3D 对象上的点表示成到从所述 3D 对象数据 中所选的一组点的索引, 通过将一组角度分成等大小的间隔来采样旋转角度。 优选地。
34、, 通过 均匀地或随机地采样 3D 对象的表面而从 3D 对象数据中选择该一组点。 0018 更优选地, 在步骤 (a) 中, 从所述对象强度数据中提取对象特征点。优选地, 特征 点为边缘点, 优选地, 使用 3D 对象数据过滤边缘点以仅获得在深度不连续面上或对象的轮 廓上的边缘点。 0019 更优选地, 在步骤 (e4) 中, 使用数据结构计算姿势, 所述数据结构允许搜索类似于 所述参考点与所选的场景特征点的对的 3D 对象点与对象特征点的对。优选地, 搜索点对的 步骤包括以下步骤 :(e4a) 计算描述所述参考点、 所选的场景特征点及其关系的点对描述 符 ; 和 (e4b) 将所述点对描述。
35、符用作到所述数据结构的索引。 0020 优选地, 点对描述符描述按照对象特征点的距离而缩放的特征向量, 特征向量描 述样本点与所提取的对象特征点在强度数据的图像平面内的距离, 以及点对描述符描述边 缘的相对取向、 表面点法线和两点间的差向量。 参照另一优选实施方式, 点对描述符额外地 包含以下可选特征 : 为特征点计算的特征点描述符 ; 每点处的颜色值或灰度值 ; 每点处的 纹理信息 ; 每点处的表面描述符 ; 每点处的曲率 ; 每点处的其它几何表面信息。 0021 根据优选实施方式, 步骤 (e4b) 包括 :(e4c) 采样所述点对描述符 ;(e4d) 使用数据 结构, 所述数据结构将采样。
36、的点对描述符映射到点对的一列表。优选地, 在步骤 (e4d) 中, 将哈希表用作数据结构。 0022 根据优选实施方式, 步骤 (f) 中的计算包括 :(f1) 定义所述候选姿势之间的相邻 说 明 书 CN 103729643 A 8 5/12 页 9 关系 ;(f2) 按照相邻的候选姿势的分数的加权和计算每个姿势的分数 ;(f3) 通过按照在 (f2) 中所计算的分数把所述姿势分等级而选择一组过滤姿势。优选地, 通过取所述姿势的 平移和所述姿势的旋转的差值的阈值或者通过取所述 3D 对象上的点在两种姿势下可具有 的最大距离的阈值来定义所述相邻关系。该方法还可以包括以下步骤 : 按照所述相邻姿。
37、势 上的平均姿势再计算 (f3) 中所选的姿势。优选地, 加权取决于候选姿势和当前相邻姿势。 0023 优选地, 本发明的方法还包括以下步骤 : 通过优化误差函数而细化所述一组过滤 姿势中的每个姿势, 该误差函数基于以下中的一种或两种 : 所述姿势下所述 3D 场景与所述 3D 对象之间的距离 ; 所述姿势下的所述场景强度数据与所述模型强度数据的一致性。 0024 优选地, 本发明的方法还包括以下步骤 : 针对该组过滤姿势中的每个姿势计算分 数, 其中, 该分数描述所述姿势下 3D 场景与 3D 对象之间的一致性。 0025 优选地, 本发明的方法还包括以下步骤 : 针对最终姿势中的每个姿势计。
38、算分数。 优 选地, 所计算的分数为 3D 场景中的在所计算的姿势下位于 3D 对象的表面上的点的数量。 附图说明 0026 结合附图, 从以下详细描述中将更全面地理解本发明, 附图中 : 0027 图 1 示出如何通过均匀采样使 3D 数据正则化 ; 0028 图 2 示出可以如何描述 3D 点与图像点之间的关系 ; 0029 图 3 示出对象坐标系、 局部坐标系和使用局部坐标的场景坐标系之间的变换。 具体实施方式 0030 符号和定义 0031 以下所有数据被认为是可以以电子形式使用, 优选地为数字的。所描述的方法和 算法被认为是以电子形式的且可用计算机实现的。 0032 在以下符号中, 。
39、3D点为3D空间中具有三个坐标值的点。 每个3D点指的是坐标系, 最值得注意的坐标系为限定3D场景数据的场景坐标系和限定所关注的3D对象的对象坐标 系。3D 向量为 3D 空间中具有三个坐标值的向量。在表面上一点处的 3D 法向量为 3D 空间 中具有 1 欧几里德长度且在给定点处垂直于该表面的向量。3D 点云为一组 3D 点。定向的 3D 点云为其中的 3D 法向量与每个点都相关联的 3D 点云。3D 刚性变换为保持点距离的 3D 点到 3D 点的映射, 在形式上为映射 f, 使得对于任意点 P、 Q, 等式 |PQ|=|f(P)-f(Q)| 成 立。每个 3D 刚性变换可分解成旋转和平移,。
40、 其中, 首先对变元点应用旋转, 然后对结果应用 平移。形式上, 可将每个 3D 刚性变换分解成 3D 旋转 R 和 3D 向量 T, 从而使 f(P)=R(P)+T。 0033 3D数据正则化为一种将3D中的表面变换为一组3D点的方法, 该组3D点均匀地分 布在所述表面上, 如图 1 所示。在优选实施方式中, 3D 数据正则化为这样一种方法 : 将 (a) 描述 3D 中的 2D 表面的 3D 数据 101 和 (b) 采样距离 d 作为输入 ; 输出一组 3D 点 102, 该组 3D 点 102 具有如下性质 :(a) 其仅包括也在输入的 3D 数据的表面上的点,(b) 在形成的点 云中。
41、的所有对点具有至少为 d 的距离, 以及 (c) 在输入的 3D 数据中的每个点都具有在输出 组中的点, 该点具有至多为 d 的距离。在本发明的优选实施方式中, 对于 3D 点组, 只是当输 出云中已没有点比采样距离更接近新点的时候, 才通过迭代该组输入点并将每个点都添加 到输出组中来产生具有预期性质的正则化的点组。 通过将每个面采样成一组点并如前所述 说 明 书 CN 103729643 A 9 6/12 页 10 处理形成的点组来变换 3D 的 CAD 模型。在替选实施方式中, 通过从表面上随机地选择点来 使 3D 数据正则化。在另一替选实施方式中, 法线方向用于正则化, 其中, 子采样点。
42、组在高曲 率的区域中是更密集的。在优选实施方式中, 计算从 3D 数据的表面所选择的点的曲面法线 103。 0034 对输入的点云进行正则化通常产生具有较少量点的云, 该云仍能很好地表示原始 云。 本发明在脱机阶段和联机阶段中都使用正则化, 用以有效地减少点的数量, 从而产生更 快速的性能。这对于局部参数空间的采样也是重要的, 如下所述。在优选实施方式中, 明确 地相对于对象的直径而参数化采样距离 d, 其中, 该直径为 3D 对象上的两点之间的最大距 离。令 Dobj为对象的直径, 则利用 d使采样距离 d 参数化成 d=d Dobj。在替选实施方式 中, 用户给出采样因子。在另一替选实施方。
43、式中, 根据先验信息 (例如 3D 数据的噪声级) 设 置采样因子。 0035 场景的强度数据或对象的强度数据为从一个或多个给定视点和观察方向上, 通过 测量从场景或对象所发出的光的量而获得的所述场景或对象的外观。 通常以强度图像的形 式来表示强度数据。对于真实场景或对象, 通常使用成像设备 (例如相机) 来捕获强度数据。 此外, 可以通过将 3D 数据渲染成虚拟视图而从所述 3D 数据合成地创建强度数据。这种渲 染成的视图的可能质量取决于所提供的 3D 数据的类型和质量。可以利用附加的纹理信息 增补 3D 数据, 纹理信息可以用在渲染过程中, 以创建 3D 数据的更逼真的图像。强度数据可 以。
44、包括一个或多个数据通道, 每个通道代表场景或对象的外观的过滤后的形式。 通常, 多通 道代表光的不同波长, 且例如允许彩色形式的场景或对象。通常, 使用像素的 2D 网格来表 示强度数据。在下文中, 该 2D 网格内的位置也被称为强度数据中的点、 图像内的位置或图 像内的坐标。 0036 特征点为强度数据中的点。特征点可以在整个强度数据中密集地或均匀地分 布, 或者可以在强度数据内的突出位置处定位。从文献得知许多不同类型的特征点。通 常在存在噪声、 杂波、 闭塞和其它干扰时, 将特征点设计成具有稳定的且可重复的位置。 在优选实施方式中, 将边缘点用作为特征点。在优选实施方式中, 使用 Cann。
45、y 边缘提取 器 (Canny,J.,A Computational Approach To Edge Detection,IEEE Transactions on Pattern Analysis and Machine Intelligence,8(6):679-698,1986) 。 在替选实施方式中, 可以使用任何其它类型的特征点。 0037 特征描述符为在特征点周围的区域中的强度数据的压缩描述符。通常, 特征描述 符用于通过从强度数据的一部分中提取最有表现力的信息而利用压缩感描述所述部分。 特 征描述符通常用于识别在其它位置或视图中的强度数据的类似部分, 或者用于识别在不同 强度图像。
46、中的相同的空间部分。在优选实施方式中, 将在特征点的位置处的强度数据的梯 度方向用作特征描述符。在替选实施方式中, 可将在特征点的位置处的强度值用作特征描 述符。在其它替选实施方式中, 可使用任何其它种类的特征描述符。可将多个不同的特征 描述符组合成单个特征描述符。 0038 点对描述符为描述一对点的值的列表, 其中, 该对点中的一点为 3D 点, 另一点为 特征点。在优选实施方式中, 首先获得 3D 点在强度数据内的位置。于是, 该点对描述符包 括强度数据的图像平面内的两点之间的距离、 边缘方向与两点间的差向量之间的角度、 3D 点的法向量与差向量之间的角度、 以及法向量与朝向强度数据的投影。
47、中心 (通常为相机中 说 明 书 CN 103729643 A 10 7/12 页 11 心) 的方向之间的角度。在另一优选实施方式中, 特征点的附加特征描述符和 3D 点的附加 特征描述符包括在点对描述符中。 在替选实施方式中, 局部特性 (例如在两点处的表面的颜 色、 在两点处的曲率和其它几何特性) 、 以及在背景技术部分中所提及的局部点描述符可以 包括在点对描述符中。 在替选实施方式中, 可以使用其它测量值来描述这两个点及其关系, 而不脱离本发明的范围。向点对描述符添加更多信息将增大其区别不同对点的能力, 但也 增大了其复杂度, 从而增大了计算、 储存或处理描述符的复杂度。 0039 在。
48、优选实施方式中, 如图 2 所示, 具有法线 nr且位于强度图像内的 r 处且从方向 r上可见的 3D 点 P 和具有边缘法线 e1的边缘点 e 的点对描述符 F 的形式定义为 0040 (1) F(P,e,nr,ed)=(|r-e|/Pz, (ed,r-e), (nr,P2-P1), (r,nr) 0041 其中, (a,b) 表示两个向量之间的角度。 0042 采样的点对描述符为点对描述符的采样形式。在优选实施方式中, 以相同大小的 间隔对点对描述符的四个项目进行采样以产生采样的点对描述符。 采样的点对描述符的形 式定义如下 : 令 na为用于角度值的间隔的数量且 da=360 /na。令。
49、 d 为如上所述的距离采 样因子, 且令为小于 x 的最大整数值, 则点对特征 F(P,e,nr,ed)=(F1,F2,F3,F4) 的采样形 式 FS(P,e,nr,ed) 被定义为 0043 0044 全局模型描述为一种数据结构, 该数据结构允许有效地搜索对象上与来自场景的 给定点对类似的全部点对。 因此, 数据结构或方法将来自场景的点对作为输入, 并且输出对 象上与输入点对类似的点对的列表。在优选实施方式中, 将从采样的点对描述符到点对组 的映射用作点对描述符。 通过为给定点对计算采样的点对描述符且使用哈希图检索所有具 有相等的采样的点对描述符的点对来进行查找。 哈希表允许有效地访问类似的点对, 其中, 定时独立于储存在模型描述中的点对的数量。在替选实施方式中, 可使用最近邻访问方法 来检索所有具有与给定点对的点对描述符类似的点对描述符的点对。 在另一替选实施方式 中, 可将任意索引方案用作数据结构, 例如搜索树。 0045 在假设给定的参考点位于对象的表面上的情况下, 可将场景中的对象的局部姿势 定义为场景中的对象相对于给定的 3D 场景点 (称为参考点) 的。