摘要:随着虚拟现实逐渐流行,出现了新的交互需求,传统的交互方式并不能很好的在这一场景应用,因此在空间中的手势识别方案被视为虚拟现实的理想交互方式。本文提出基于三维雷达阵列识别在消费电子控制场景中经常使用的10个人手手势。该雷达阵列由三个相互垂直安装的24 GHz K波段多普勒连续波微型I / Q(同相和正交)收发器传感器组成。从六个通道的I / Q信号中提取幅度和相位特征以进行时间和频谱分析。我们使用卷积神经网络来实现识别。利用以频谱为输入的双层CNN(卷积神经网络)分类器进行识别。最后,论文对实验进行了论证,并分别对雷达阵列的性能进行了分析。结果表明,该系统可以达到高于92%的高识别准确率。
关键词:手势识别,雷达阵列,多普勒效应,卷积神经网络。
1.介绍
为了便于未来的HCI(人机交互),手势识别最近成为一个热门的研究课题,它旨在将基于视觉图像手势解释为数字信息传输给计算机[1]。摄像机和其他成像传感器提供了直接捕获手势的简单解决方案,因为图像最容易被人类视觉神经元系统识别。然而,视觉图像对计算机的解释是不同的。图像从多维数字数组转换为一些不同的特征,以便使计算机识别姿势的含义。该过程可能导致对计算资源的需求增加,并且需要有效的算法来解释视觉图像。此外,照明也是影响该方法有效性的关键因素。同时,可穿戴的传感器也是一种流行的实时手势识别的解决方案[2]。然而,该解决方案需要牢固地佩戴在手上的传感器,例如戴着一副手套。手的不适和不灵活是阻碍这种方法在日常生活中广泛传播的主要因素。在当今计算机技术发展的时代,微波工程已经成为手势识别的一种新兴的解决方案。同时,如今模拟和数字硬件的加速发展使得能够以低成本开发毫米波段电路,从而使雷达成为用于手势识别的传感器更具吸引力。2016年,谷歌发布了Soli项目,该项目使用60GHz FMCW(调频连续波)雷达来实现识别[3]。然而,该系统在很大程度上依赖于定制雷达芯片,该芯片仍处于早期开发阶段[4]。与Soli不同,本文旨在找到使用可获得的商业雷达传感器来实现非接触式手势识别的经济解决方案。本文的结构如下:在下一节讨论手势识别的发展。然后介绍了手部动力学模型,目标手势和雷达阵列结构。此外,本文还规定了基带I / Q(同相和正交)信号的处理,并通过实验使用决策树和CNN(卷积神经网络)评估识别性能。最后,本文最后总结了这种丢失成本解决方案在未来应用中的建议。
2.先进的基于雷达的手势识别系统
使用雷达技术实现手势识别的概念受到使用扬声器和麦克风识别不同手势的尝试的启发[5]。但由于声波的测距分辨率有限,因此不再采用这种方法。CW(连续波)雷达具有结构简单,灵敏度高,频谱占用窄等特点,能够根据多普勒效应比较雷达发射器和接收器之间电磁波的频移,从而检测目标移动速度。通过调制频率,连续波雷达可以测量目标到天线的距离。使得能够得知雷达天线主波束径向上的目标位置。最近,基于雷达的传感的大量工作已经证明了使用毫米连续波雷达的实时或近实时高分辨率成像的能力[6]。此外,Molchanov和他的团队通过使用25 GHz FMCW单脉冲雷达探测手势识别,其范围分辨率为3.75 cm,用于智能驾驶辅助[7]。参考文献[8]介绍了一种使用77 GHz FMCW雷达系统和隐马尔可夫模型进行分类的手势识别系统。在构建速度 - 能量矢量之前执行距离选通,该系统能够实现手势分类,同时消除可能破坏手势识别任务的其他目标所贡献的能量。此外,参考文献 [9]演示了一种自动分类系统,该系统使用60.5 GHz雷达发送一系列线性调频信号,带宽为7 GHz。该分类系统允许同时高分辨率测量8种人手和身体姿势的距离和径向速度,准确率高达95%。此外,[10]中描述了一个带有片上天线的完全集成的94 GHz脉冲雷达收发器,可以在便携式设备上检测手指的移动并实现实时手势检测等应用。此外,手势识别中最令人印象深刻的成就发布于2016年Google I / O大会Google展示了Soli项目的成就,该项目可以通过应用机器学习和处理时间信号来区分复杂的手指运动和手形变化[3] [11]。目前使用毫米波雷达进行手势识别的研究主要是利用雷达信号处理来寻找分类特征。典型的方法从设计调频波形开始。雷达发射调频电磁波,天线波束内的目标散射该能量,一部分被反射回雷达天线。可以使用二维FFT(快速傅立叶变换)将反射信号变换到频域。发射的电磁波的频率调制将使得能够生成包含目标属性的距离 - 多普勒图,例如位置和运动速度。CFAR(恒虚警率)检测经常用于信号处理,以减少噪声干扰。然而,这些手势方法高度依赖于雷达设备的性能。频率调制增加了雷达设计复杂性和硬件成本。例如,Soli项目的大多数成就都在Alpha开发者计划的框架内,这是一个由Google建立的封闭社区。在这个环境下,开发者会收到Google的开发板和软件来进行应用和开发。
赞助商广告