对AR/VR头显来讲,手势识别是一项关键技术。如果说电脑最直接的输入方式是键盘鼠标,那么目前AR/VR最直接的输入方式应该是手势操控,它甚至比手柄用起来更方便。
此前,FacebookRealityLabs就曾表示:手势识别将有望降低AR/VR的使用门槛,是一种更加自然的人机交互方式。FRL甚至已经开始探索用手势识别来替代真实键盘的方向,如果未来这种功能登陆Quest等VR或AR头显,或有望为AR/VR带来办公、网页浏览等更多应用场景。
目前,市面上大多数手势识别方案采用摄像头加计算机视觉算法的设计,比如:外接的手势识别模块LeapMotion,或是Quest、Varjo、HoloLens等AR/VR头显集成的摄像头方案等等。这些方案的缺点是,用户的手需要在摄像头视场角范围内才能被识别。
相比之下,利用电脉冲、肌电等生物信号来识别并推断手势的穿戴式方案准确性可能更高,比如去年被Facebook收购的CTRL-Labs就曾开发出可以识别非健全手掌动作意图的技术,可以为残障人士在VR中模拟出动态的健全手掌。但这种手环方案成本较高,而且市面上还未推出成熟的产品。
也就是说,或许未来VR头显不需要通过自带的摄像头来追踪手势,而是可以通过搭载摄像头的智能手表来控制,智能手表不仅能追踪普通的手势,还可以对手指的文字输入意图进行推断,在沉浸的VR环境中也能快速输入,无需实体键盘。
而相比于电脉冲手环方案,Back-Hand-Pose成本更低,更容易应用在现有的穿戴设备中,以推动手势识别在消费级市场的规模应用。
比如,在今年UIST会议上Koike实验室还发表了利用单个穿戴式RGB摄像头来识别3D姿态(头部、四肢等等)、通过集成在球上的两颗广角摄像头来捕捉赛场的多角度全景图像两项实验论文。
从Koike实验室的研究可以看出,通过结合计算机视觉算法与摄像头方案,可以为许多以往需要昂贵传感器才能实现的方案提供更低成本的替代选项。就像手机、AR/VR头显自带摄像头那样,或许未来我们的耳机、手表甚至项链也可以配备摄像头,为原本的设备带来更智能的用途。