谈及人机交互,PC端我们最先想到的便是鼠标、键盘;而在移动互联时代,更多是在智能手机或pad上,使用多点触摸进行交互。未来,随着智能移动终端的不断更迭,更加人性化的交互方式也将随之出现。
在昨天的大会上,亮亮视野首次提出了“第一视角计算”的概念。在亮亮视野CEO吴斐看来,以AR智能眼镜为载体,基于第一视角计算的人工智能技术将得到进一步整合,更加自然、实用的人机交互系统雏形已然显现。
亮亮视野CEO吴斐
亮亮视野成立于2014年,旨在通过第一视角交互,实现多维度的连接、认知与协同,推动人机协作,服务行业领军企业,实现智能化升级。而为了更加详细的了解第一视角计算的奥秘,87君在会后对吴斐进行了一次专访。
“好”的AR眼镜应该长啥样?
2014年,谷歌推出了首款AR眼镜产品Google Glass,这款AR可穿戴产品曾被寄予厚望。然而,现实情况往往事与愿违,Google Glasse超高的售价以及尚不完善的用户体验,最终让这款产品遭受了停产的厄运,AR热潮也暂告一段落。尽管如此,AR行业的发展依旧如火如荼,随着硬件技术的不断发展,人们不禁想问:“怎样的AR产品才算是真正‘合格’的呢?”
Google Glass
“符合用户需求,是任何产品诞生的根本意义所在。当然,AR眼镜也不例外。”在吴斐看来,AR眼镜只是承载技术的一种产品形态,其背后则代表了某个应用场景下的一整套完善解决方案。
“客户需求是什么?如果你的产品采用了目前状态下客户需要的最优解决方案,那就是一款好的AR产品。”吴斐分析道,一般来说,硬件上我们需要去做减法。以移动警务安防方案为例,用户的需求首当其冲的就是设备足够轻。在此基础上,才能来衡量哪些AR眼镜的功能使用频次较高,而哪些功能其实并不需要并作出取舍,将被保留部分的体验做到最好。
“老实说,市场需要怎样的产品?需要怎样的一套解决方案?这并非仅靠思考就能断言,而是要经过十分漫长的验证过程。在这方面,亮亮视野付出了很多时间和精力。”
亮亮视野GLXSS ME
针对安防领域,亮亮视野于今年1月份推出AR眼镜GLXSS ME,这也是市面上首款“人工智能”AR眼镜。除了显示之外,该眼镜还可进行前端人脸物体的采集和识别,人脸识别准确率达到99.7%。目前,亮亮视野已经发布多款AR眼镜,在工业、医疗、安防等领域均已建立起完善的解决方案。
自2017年第四季度起,亮亮视野便进入到规模商业化阶段,月订单突破K级。而阵列光波导方案L-PAT也已经在昨日首次亮相。吴斐告诉87君,该方案已可量产,接下来亮亮视野将携手对光波导方案感兴趣的客户厂商进一步展开对应用场景的探索,助力光波导方案尽早走进行业市场。
第一视角计算的机遇与挑战
人在观察世间万物的过程中,人眼会主动过滤掉很多视觉信息。人们往往会格外关注自己在意的事物,自动将无关紧要的因素过滤掉。而最主要的是,这个过程完全是自主发生的,无需触发,更无需靠外设来启动——这就是人眼的“第一视角主动感知”能力。
“很显然,目前没有一台设备称得上是主动感知的。各种摄像头镶嵌在大街小巷,他们无时不刻在监视着这个世界的一举一动。然而,他们只知道完全记录、分析所看到的所有东西,它们不具备类似人眼的筛选机制”,吴斐补充道,被动感知记录信息,其数据量级是相当庞大的。随着信息的不断积累,对终端算力地挑战也会越来越大。
吴斐认为,AR眼镜的设定让摄像头记录信息的方式从第三方视角转变为第一人称视角。与人眼位置的靠近,可以让机器视觉更好的与人眼产生协作,产生实时可标记信息,近而改善人机交互模式。当然,要让机器做到主动感知并不是一件容易的事情。吴斐分析道,第一视角计算需要完整的注意力模型、云端计算和边缘计算技术作为支撑,结合实际应用场景,经过不断试错最终形成一个闭环方案。
就目前而言,注意力模型、边缘计算技术的发展还存在较多尚未攻克的难点,这在一定程度上影响了前端AR眼镜的工作效率。为了解决这些问题,亮亮视野携手中科院成立了“第一视角计算联合实验室”,专注于第一人称算法的理论研发工作,旨在找到可行、通用的问题解决方案,并应用于AR智能眼镜方案之中。
在吴斐看来,第一视角计算的意义远不止如此。就安防、工业领域中的客户需求来看,前端、云端、边缘算力往往需要相辅相成。“没有简单的答案和公式告诉我们,哪些信息需要实时解决?哪些可以分时解决?哪些需要在云端解决?这一切都由场景需求决定。在考虑到成本和一眼效果的同时,找到不同应用场景下平衡算力的最佳解决方案,这正是亮亮视野一直在做的事情。”
一切只为商业化落地
“未来两年内,我希望能让垂直行业内几十万人都用到我们的AR智能眼镜!”采访的最后,吴斐这样说道。
在他看来,在完成亿元B+轮融资后,亮亮视野便进入到了发展快车道。公司接下来将在核心技术研发、应用场景探索、人才招纳各方面加大力度。结合人工智能技术,亮亮视野推出了第一视角计算基础库Laffe,开发者们能在智能眼镜上快速部署各种主流深度学习框架(如Caffe/Mxnet/TensorFlow)训练模型。
未来,Laffe有望被打造成首个第一视角计算的通用型开发平台。