专利 骨骼序列行为识别方法和装置

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210615403.1 (22)申请日 2022.06.01 (71)申请人北京爱笔科技有限公司地址 100094 北京市海淀区北清路81号二区1号楼12层1202室、 13层整层 (72)发明人王青天　 (74)专利代理机构北京集佳知识产权代理有限公司 11227 专利代理师张静 (51)Int.Cl. G06V 40/10(2022.01) G06V 10/74(2022.01) (54)发明名称骨骼序列行为识别方法和装置 (57)摘要本申请提供了一种骨骼序列行为识别方法，包括：获取包含多帧骨骼编码帧的待处理骨骼编码帧组中只包含拓扑结构对应的骨骼编码单位，而不具有拓扑结构的细节关键点；将骨骼编码帧组作为初始输入信息输入目标处理模型，目标处理模型包括至少两层处理模块，控制每层处理模块中的空间维度处理单元和时间维度处理单元分别对于输入信息进行拓扑结构内变化和拓扑结构间变化的处理，得到目标处理结果；基于目标处理结果，确定该骨骼编码帧组对应的行为动作，最终得到该骨骼编码帧组对应的行为动作既能够对于大幅动作进行区分，也能够对于细节动作识别。权利要求书3页说明书23页附图11页 CN 114821671 A 2022.07.29 CN 114821671 A 1.一种骨骼序列行为识别方法，其特征在于，包括：获取待处理的骨骼编码帧组，所述待处理的骨骼编码帧组包含多帧骨骼编码帧，每帧骨骼编码帧中包括多个骨骼编码单位，一个骨骼编码单位与动物体的一个拓扑结构相对应，每个骨骼编码单位对应一个第一数组，所述第一数组包括至少一个数据；将所述骨骼编码帧组作为初始输入信息输入目标处理模型，所述目标处理模型包括至少两层处理模块，每层处理模块包括空间维度处理单元和时间维度处理单元；控制目标处理模型中每层处理模块中的空间维度处理单元和时间维度处理单元分别对于输入信息进行拓扑结构内变化和拓扑结构间变化的处理，得到目标处理结果；基于所述目标处理结果，确定所述骨骼编码帧组对应的行为动作。 2.根据权利要求1所述的方法，其特征在于，所述获取待处理的骨骼编码帧组之后，还包括：依次对所述骨骼编码帧组中骨骼编码单位对应的第一数组排序，得到第一骨骼编码序列；在所述第一骨骼编码序列前面插入第一标识，得到第二骨骼编码序列，所述第二骨骼编码序列用于作为所述目标处理模型的初始输入信息。 3.根据权利要求1 ‑2任一项所述的方法，其特征在于，控制目标处理模型中每层处理模块中的空间维度处理单元和时间维度处理单元分别对于输入信息进行拓扑结构内变化和拓扑结构间变化的处理，得到目标处理结果，包括：对于输入当前层的输入信息在空间维度和时间维度分别进行拓扑结构内变化和拓扑结构间变化的处理，得到当前层的处理结果；将当前层的处理结果作为下一层的输入信息进行空间维度和时间维度的处理，直至所述目标处理模型中每一层处理完成处理，输出目标处理结果。 4.根据权利要求3所述的方法，其特征在于，对于输入当前层的输入信息在空间维度和时间维度分别进行拓扑结构内变化和拓扑结构间变化的处理，得到当前层的处理结果，包括：控制空间维度处理单元，对于所述当前层的输入信息进行拓扑结构内变化和拓扑结构间变化的处理，得到第一输出信息；控制时间维度处理单元基于所述第一输出信息，对于所述第二骨骼编码序列进行拓扑结构内变化和拓扑结构间变化的处理，得到第二输出信息，所述第二输出信息作为当前层的处理结果。 5.根据权利要求4所述的方法，其特征在于，控制空间维度处理单元，对于所述当前层的输入信息进行拓扑结构内变化和拓扑结构间变化的处理，得到第一输出信息，包括：控制空间维度处理单元，从输入当前层的所述输入信息中获取第一目标信息，所述第一目标信息与所述第一标识的位置、长度分别对应；在空间维度，计算所述第一目标信息与第一非目标信息中每个第二数组的第一相似度，基于所述第一相似度得到第一结果值，所述第二数组与第一数组的长度相同，所述第一非目标信息是所述输入信息中除了第一目标信息的剩余信息；以帧为单位计算得到多帧骨骼编码帧中拓扑结构间的第一变化值，以拓扑结构为单位，计算得到骨骼编码帧中每个拓扑结构内的第二变化值；权　利　要　求　书 1/3 页 2 CN 114821671 A 2基于所述第一变化值以及所述第二变化值，得到第二结果值；基于第一结果值和第二结果值，计算得到所述第一输出信息。 6.根据权利要求4所述的方法，其特征在于，控制时间维度处理单元基于所述第一输出信息，对于所述第二骨骼编码序列拓扑结构内变化和拓扑结构间变化的处理，得到第二输出信息，包括：控制时间维度处理单元将所述第一输出信息与所述第二骨骼编码序列相加，得到第三骨骼编码序列；从所述第三骨骼编码序列中获取第二目标信息，所述第二目标信息与所述第一标识的位置、长度分别对应；在时间维度，计算所述第二目标信息与第二非目标信息中每个第三数组的第三相似度，基于所述第三相似度得到第三结果值，所述第三数组与第一数组的长度相同，所述第二非目标信息是所述输入信息中除了第二目标信息的剩余信息；以帧为单位计算得到多帧骨骼编码帧中拓扑结构间的第三变化值，以拓扑结构为单位，计算得到骨骼编码帧中拓扑结构内的第四变化值；基于所述第三变化值以及所述第四变化值，得到第四结果值；基于第三结果值和第四结果值，计算得到所述第二输出信息。 7.根据权利要求4所述的方法，其特征在于，控制空间维度处理单元，对于所述当前层的输入信息进行拓扑结构内变化和拓扑结构间变化的处理，得到第一输出信息，包括：控制空间维度处理单元在空间维度，以帧为单位计算得到多帧骨骼编码帧中拓扑结构间的第五变化值，以拓扑结构为单位，计算得到骨骼编码帧中每个拓扑结构内的第六变化值；基于所述第五变化值以及所述第六变化值，得到第一输出信息。 8.根据权利要求4所述的方法，其特征在于，控制时间维度处理单元基于所述第一输出信息，对于所述第二骨骼编码序列拓扑结构内变化和拓扑结构间变化的处理，得到第二输出信息，包括：控制时间维度处理单元将所述第一输出值与所述第二骨骼编码序列相加，得到第三骨骼编码序列；在时间维度，以帧为单位计算得到多帧骨骼编码帧中拓扑结构间的第七变化值，以拓扑结构为单位，计算得到骨骼编码帧中每个拓扑结构内的第八变化值；基于所述第七变化值以及所述第八变化值，计算得到所述第二输出信息。 9.根据权利要求3所述的方法，其特征在于，基于所述目标处理结果，得到所述骨骼编码帧组对应的行为动作，包括：获取所述目标处理结果中的第三目标信息，所述第三目标信息与所述第一标识的位置、长度分别对应；基于所述第三目标信息对应的类型，确定所述骨骼编码帧组对应的行为动作。 10.一种骨骼序列识别方法，其特征在于，包括：接收输入信息，所述输入信息是目标处理模型中上一结构发送至当前处理模块的信息，所述目标处理模型包括输入层和至少两层transformer模块，每层transformer模块包括空间维度处理单元和时间维度处理单元，所述上一结构包括输入层、空间维度处理单元权　利　要　求　书 2/3 页 3 CN 114821671 A 3

专利 骨骼序列行为识别方法和装置

专利骨骼序列行为识别方法和装置