《基于静态帧的部件运动性预测方法.docx》由会员分享,可在线阅读,更多相关《基于静态帧的部件运动性预测方法.docx(25页珍藏版)》请在优知文库上搜索。
1、PATEXPLRER专利探索者一全球创新始于探索基于静态帧的部件运动性预测方法申请号:CN.1申请日:20170831申请(专利权)人:深圳大学地址:广东省深圳市南山区南海大道3688号发明人:胡瑞珍,黄惠主分类号:G06T7/20公开(公告)号:CNB公开(公告)日:20200110代理机构:北京三友知识产权代理有限公司代理人:王涛,汤在彦(19)中华人民共和国国家知识产权局(10)授权公告号CNB(45)授权公告日20200110(21)申请号CN.1(12)发明专利(22)申请日20170831(71)申请人深圳大学地址广东省深圳市南山区南海大道3688号(72)发明人胡瑞珍,黄惠(74
2、)专利代理机构北京三友知识产权代理有限公司代理人王涛,汤在彦(54)发明名称基于静态帧的部件运动性预测方法$的立项方氏对:地彩状中的每个t.MkPtf s20, 出&个如兀.内嵌据占地先M“师”心动手心4行外分.V情U依分IW已为妥个狡,儿X建(57)摘要本发明提供了一种基于静态帧的部件运动性预测方法,包括:根据物体的运 动方式对一组三维形状中的每一个三维形 状中构建出多个运动单元,并根据运动类 型对所有运动单元进行划分;计算每一运 动单元中静态帧的帧描述子;根据运动单 元的每一运动类型,学习出每一运动类型 的运动单元中的静态帧到不同运动单元的 距离函数;根据待查询的静态帧,利用距 离函数选择
3、与待查询的静态帧距离值最小 的运动单元,得到该运动单元及其运动类 型;根据待查询的静态帧及得到的运动单 元及其运动类型生成多组候选的运动,对 候选的运动进行采样,得到可应用于待查 询的静态帧的最佳运动参数。本发明可以 预测出现在物体静态帧上静态部件的运 动。WX*尔几的何更中.H用中N学。“出M 类型的汇刈单元中的辟占务到不同恒动元的浑ArRS2O22(klH在由的怜依.利用所V真力数比样,所注代介门的AJ4SM&JSfAJft外的运动运动中儿/Uls0大P出依隅洋小代甫的静金做小儿及NK淤Pl改JS*/做送出动.所菱Ka的ts*lh联样,t5Jn.应UH场域-J 希夕附的静的AMt诏动少看权
4、利要求书L一种基于静态帧的部件运动性预测方法,其特征在于,包括:根据物体的运动方式对一组三维形状中的每一个三维形状构建出多个运动单元,并根据运动类型对所有运动单元进行划分,每一三维形状分割为多个独立几何部件,所述运动单元中包括多个静态帧,所述运动单元的划分基于运动参数,所述运动参数包括:运动类型、候选轴的方向参数、候选轴的位置参数及范围参数;计算每一运动单元中静态帧的帧描述子,所述帧描述子以多个多维的几何特征表示,描述了静态帧中的运动部件与参考部件的交互及所述运动部件与参考部件的位置关系:根据运动单元的每一运动类型,利用度量学习方法,学习出每一运动类型的运动单元中的静态帧到不同运动单元的距离函
5、数;根据待查询的静态帧,利用所述距离函数选择与所述待查询的静态帧距离值最小的运动单元,得到该运动单元及其运动类型;根据所述待查询的静态帧及得到的运动单元及其运动类型生成多组候选的运动,对所述候选的运动进行采样,得到可应用于所述待查询的静态帧的最佳运动参数。2 .根据权利要求1所述的基于静态帧的部件运动性预测方法,其特征在于,所述运动单元中的多个静态帧中包括初始静态帧及末尾静态帧。3 .根据权利要求1所述的基于静态帧的部件运动性预测方法,其特征在于,还包括:根据运动部件的运动时间对所述运动单元中的多个静态帧进行排序。4 .根据权利要求1所述的基于静态帧的部件运动性预测方法,其特征在于,所述运动参
6、数包括:运动类型、平移轴或旋转轴的主方向、平移轴或旋转轴所处的位置、运动范围。5 .根据权利要求1所述的基于静态帧的部件运动性预测方法,其特征在于,计算每一运动单元中静态帧的帧描述子,包括:利用交互二分面捕获运动部件与参考部件的交互及部件表面与所述交互二分面相关联的交互区域;利用关系增强图像描述子表示运动部件与参考部件间的相对位置关系。6 .根据权利要求5所述的基于静态帧的部件运动性预测方法,其特征在于,利用关系增强图像描述子表示运动部件与参考部件间的相对位置关系,包括:将关系增强图像描述子在二维中的像素替换成三维中的体素,并将二维中的圆替扩展为三维中的球体;使用三维空间中三个相互正交的平面对
7、球体的空间进行分割,并按球体的半径将球体划分为内部球体和外部球体,得到16个空间划分。7 .根据权利要求1所述的基于静态帧的部件运动性预测方法,其特征在于,根据运动单元的每一运动类型,利用度量学习方法,学习出每一运动类型的运动单元中的静态帧到不同运动单元的距离函数,包括:采用度量学习方法,在两种类型约束条件下,根据运动单元中静态帧的几何特征,学习出每一运动类型的运动单元中的静态帧到不同运动单元的距离函数;所述约束条件包括:静态帧与相同运动类型的运动单元之间的距离应更近于到其它不同运动类型的运动单元之间的距离:静态帧与相同运动类型的运动单元之间的距离小于静态帧与不同运动类型的运动单元之间的距离。
8、8 .根据权利要求7所述的基于静态帧的部件运动性预测方法,其特征在于,还包括:根据运动单元的运动类型将相似的运动单元进行分组。9 .根据权利要求1所述的基于静态帧的部件运动性预测方法,其特征在于,还包括:构建静态帧到运动单元的距离模型:其中,和分别是运动单元Uj的初始静态帧和末尾静态帧,In表示每一个运动单元中静态帧的数量,为运动单元中任一静态帧,是每一个运动单元中两个静态帧之间的距离。10 .根据权利要求9所述的基于静态帧的部件运动性预测方法,其特征在于,根据待查询的静态帧,利用所述距离函数选择与所述待查询的静态帧距离值最小的运动单元,得到该运动单元及其运动类型,包括:利用所述距离模型比较所
9、述待查询的静态帧到构建出的运动单元的距离,选择与所述待查询的静态帧距离值最小的运动单元。11 .根据权利要求9所述的基于静态帧的部件运动性预测方法,其特征在于,根据所述待查询的静态帧及得到的运动单元及其运动类型生成多组候选的运动,对所述候选的运动进行采样,得到可应用于所述待查询的静态帧的最佳运动参数,包括:根据所述待查询的静态帧生成初始候选的运动参数;根据所述初始候选的运动参数,生成出多个候选的运动,采样出每个运动的一组静态帧;计算每一组静态帧中静态帧到选择出的运动单元之间的距离之和,通过距离最小的一组静态帧确定最佳运动参数;利用所述最佳运动参数定义所述待查询的静态帧的运动。12 .根据权利要
10、求11所述的基于静态帧的部件运动性预测方法,其特征在于,所述最佳运动参数的运动类型与所选择的运动单元的运动类型一致。13 .根据权利要求11所述的基于静态帧的部件运动性预测方法,其特征在于,根据所述初始候选的运动参数,生成出多个候选的运动,采样出每个运动的一组静态帧,包括:利用不同的候选轴,为所述待查询的静态帧生成额外的静态帧;将所述额外的静态帧基于运动轴和变换类型在所述待查询的静态帧的两侧进行扩展;对扩展之后的静态帧进行有效性判断;将扩展之后得到的有效的静态帧组合为每个运动的一组静态帧。14 .根据权利要求13所述的基于静态帧的部件运动性预测方法,其特征在于,将所述额外的静态帧基于运动轴和变
11、换类型在所述待查询的静态帧的两侧进行扩展,包括:对于平移运动,从所述待查询的静态帧开始将运动部件沿着平移轴的两个可能方向进行平移运动;对于旋转运动,围绕所述待查询的静态帧上的旋转轴让部件按着两个旋转方向进行旋转。15 .根据权利要求13所述的基于静态帧的部件运动性预测方法,其特征在于,对扩展之后的静态帧进行有效性判断,包括:对于运动部件与参考部件碰撞的情况,判断大部分的交互是否局限在参考部件的交互区域上,如果是,则静态帧有效;对于运动部件与参考部件没有碰撞的情况,判断运动部件和参考部件之间最近距离是否小于设定阈值的两倍,如果是,则该静态帧有效。16 .一种计算机设备,包括存储器、处理器及存储在
12、存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现以下步骤:根据物体的运动方式对一组三维形状中的每一个三维形状构建出多个运动单元,并根据运动类型对所有运动单元进行划分,每一个三维形状分割为多个独立几何部件,所述运动单元中包括多个静态帧,所述运动单元的划分基于运动参数,所述运动参数包括:运动类型、候选轴的方向参数、候选轴的位置参数及范围参数;17 .一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现以下步骤:说明书基于静态帧的部件运动性预测方法技术领域本发明是关于三维物体功能性预测技术,特别是关于一种基于静态帧的部件运动
13、性预测方法。背景技术目前,在形状分析研究领域,研究从三维物体的几何和交互中获得其功能性的理解不断增多。在这一背景下,一个物体的功能性是通过分析人类或虚拟主体是如何与该物体进行可能的交互,以及邻近物体是如何从几何上与该物体相关得到的。通常,这类知识是从物体及其周围环境的静态帧中获得,例如:一个人坐在一张椅子上或桌子上摆放着几个物体。在最初的尝试中,Pirk等人1通过捕获和分析动态物体的轨迹,如运动主体尝试坐在椅子上的动作轨迹,来描述了物体的功能性。然而,先前所有的这些工作,其中心物体仍维保持其刚性。为了解决上述问题,现有技术采用了来自静态帧中的物体功能性分析方法,具体包括如下几种:基于功能可见性
14、的方法模拟了人预测物体的功能性23,或者识别场景中能让人执行特定动作的区域45。利用交互上下文描述子6和为不同类别物体学习出的功能性模型7进行分析,这两种方法考虑了更一般的物体与物体之间的交互。虽然上述的部分方法(2345)中包含了人类的动态交互,但并没有扩展到更一般的物体功能可见性类型中。而上述部分方法(67)中,物体到物体的交互本质上都是静态的。为了解决上述问题,现有技术还采用了来自动态交互的物体功能性分析方法。其中,Pirk等人1实现了从动态交互数据中预测功能性,通过分析动态交互来描述一个静态物体的功能性,例如:在喝咖啡时,一个杯子是如何被使用的。该方法中被分析的物体自身并不是动态的,因
15、而他们的分析实现在物体层次,也不是本发明中的部件层次。另外,也有一系列工作的目标在于捕获动态交互,如Kry和DineSh8提出了捕获手部交互的细节的方法。该方法专注于使用特殊的硬件来捕获交互,而并没有利用动作信息来表达功能性。在这,还有一些关于捕获工具的功能性工作9或者表达一般人类交互的工作10。然而这些工作的关注点在于识别,所以导出的功能性表达的目的并不是为了分类和转译部件的运动性。为了解决上述问题,现有技术还进行室内场景中的部件运动性分析。Sharf等人11建立了一个运动树结构来概括室内场景中物体或部件的支持关系以及它们之间相对的运动性。该方法中,首先,输入的场景分析用于搜索重复的物体或部件。然后,对给定的一个模型以独特的设置进行检测,该方法检测出模型可能包含的运动。该方法中的一个局限是依赖于输入场景中重复模型的出现,并以不同的运动状态出现,例如:处于打开或闭合状态的抽屉。因此,检测出的运动性不能被简单地转移到场景中没有出现过的物体,因为运动都是对于每个实例被单独地检测出来的。参考文献(如专利/论文/标准)lPirkS,KrsV,HuK,etal.UnderstandingandEx