Ramesh Raskar 是麻省理工学院媒体实验室相机文化研究小组的主任。他之前曾在三菱电机研究实验室担任高级研究科学家,目前正在教授一门名为“ 成像进步:VR-AR,机器学习和自动驾驶汽车 ”的课程。他最近分享了他对快速发展的成像,虚拟现实和机器学习技术的影响的看法。
R&D:普通非技术人员对成像技术的理解程度如何?
Raskar:这是一个挑战。成像是21世纪的热门话题,同时还有机器学习和虚拟现实。任何使用智能手机或戴上虚拟现实设备的人都会接触到成像。我们基本上是在谈论相机——先进的,高度发展的相机和感应设备。他们的一个重要用途是在自动驾驶汽车中,这是另一个热门话题。工程师和非专业人士应该对探索它们目前和未来的实际应用感兴趣。
R&D:在您的估计中,哪些行业应该对成像技术感兴趣?
Raskar:风险投资家,以科技为中心的创业公司,零售业。此外,来自诸如林肯实验室,国家实验室和政府官方实验室等研究实验室的人员。所有这些组织的成员都需要跟上新的发展。
R&D:成像技术如何结合机器学习来开发和编程自动驾驶汽车?我们目前在那里取得进步?
Raskar:这实际上是在成像摄像头的帮助下让电脑识别前方物体的问题。那是不是行人?一只猫还是一只狗?这是一个停车标志吗?对于人类来说这很容易,但是对于计算机来说非常困难。然而,这个问题正在通过机器学习来解决 —— 教导计算机认识这些事情。麻省理工学院的研究人员开发了一种系统,可以产生由雾覆盖的物体的图像,以至于人类视觉无法穿透它,而这套系统却可以测量物体的距离。这是一个巨大的转变。
R&D:在这些行业中,您预见到了哪些其他变革性突破?
Raskar:成像技术正在走向革命化生活和商业的道路。最明显的将是娱乐和旅游行业,只需戴上头戴设备或其他高端成像设备即可将您置于特定的地方。其他潜在的应用很多,并且正在增加。
更偏技术方向,但也很有前途的是感知压缩,其中麻省理工学院的科学家也发挥了关键作用。莱斯大学的研究人员构建了一款相机,该相机仅使用一个光传感器即可生成二维图像,而不是商品相机中的数百万个光传感器。
但是,这个过程是低效的。这种“单像素相机”需要数千次曝光才能产生合理清晰的图像。所以麻省理工学院媒体实验室的研究人员研究出了一项新技术,可以达到原本效率的50倍。在单像素相机的情况下,它可以将曝光次数从几千减少到几十次。这是显着的进步。这项技术倍成为为感知压缩。
R&D:影像科技领域主要的趋势是什么?
Raskar:我会说主要是自动驾驶汽车,机器学习和相机摄影技术的进步。手机公司经常宣传他们的设备拍照的能力超过其接听电话的能力。其次是虚拟现实与自动化的联系。这对经济具有实际意义,包括可以使用成像技术的制造,以及其他用途。
R&D:这个领域有很多投资吗?
Raskar:例如谷歌这家科技巨头,已经以约10亿美元的价格收购了三家或四家虚拟现实公司。这个行业正在创造大量的就业机会。这就是为什么公司的CEO们应该尽全力了解这一领域。成像相机无处不在。我会对那些CEO们说,你们未来的影像策略会为你创造竞争优势吗?
R&D:随着这项技术的发展,您是否看到任何问题?
Raskar:呃,我们需要民主化它。在科技世界中,有一种说法是“捕捉,分析,体验”。这也适用于大众。太多人对这些有能力改善他们生活能力的重要工具缺乏熟练度,这是教育应该进入的地方。大约五十人上了我教的麻省理工学院课程。我想提高这数量一倍,以帮助人们跟上一个快速发展的世界。