苹果VisionPro自正式上市以来引发了广泛关注,国内领先的高端VR头显制造商小派科技(PimaxTechnology)于2月29日在北京召开了一场媒体见面会,邀请了众多国内知名的科技与财经媒体前来对比体验了VisionPro和小派的旗舰产品——小派水晶(PimaxCrystal),还就空间计算的发展前景进行了深度探讨。会上小派科技副总裁李杰做了《空间计算时代,小派科技将成为“开放”赛场的“关键先生”》的演讲,以下为报告记录整理全文。
1、问候
各位新老朋友们大家好!今天是正月二十,按我们中国人的传统,正月里还都算过年。今天借这个机会,先给大家拜个晚年,祝大家龙年行大运!好运连连,万事如意!
小派科技创业八年,发展到现在,虽然跟最初憧憬的“泼天富贵”还有距离,但是整体上还算成功。跟我们一同起步的VR头显公司绝大多数都已经偃旗息鼓,而我们一步一个脚印的走下来,目前在全球高端VR头显市场中已经稳稳地站到了一线阵营。
行业的最新进展,尤其是VisionPro的发布,也给我们的发展带来了强大的新动能,我们去年的销售额有了超过100%的增长。
能取得这样的成绩,离不开媒体朋友们一直以来的支持,在此我代表我们董事长翁志彬Robin和我们小派团队全体成员,向大家表示诚挚的感谢。
2、开场
4、成绩展示,“名利双收”
半年时间过去了,行业的发展证明了我们当时的见面会形成的观点和对市场的前瞻基本都是正确的。
VisionPro发布之后,市场对高性能VR的需求被激活,小派作为消费级市场高性能VR的代表性厂家,体会到了“名利双收”的快乐。
我们最新旗舰产品小派水晶,去年年中正式发售后,仅用半年的时间,就突破了上一代产品全年的出货量,并直接推动小派2023年全年的收入实现超过100%的增长。
小派水晶在刚刚过去的CES上,获得全球消费电子领域最具含金量的奖项:CES2024InnovationAward。
我们在CES上的展位在四天的展期中始终人潮涌动,接待了来自全球的近万名专业访客,其中包括大家熟识的PalmerLuckey。今天在坐的好几位老师也都到了现场。
小派水晶被多家权威媒体评为年度最值得推荐的头显,最新一篇来自于全球最具影响力的游戏和电竞媒体平台Dexerto,小派水晶名列第五。
听上去好像没有那么厉害,但是我们来看下其他几家都是谁。Quest3排第一,VisionPro屈居第二,SonyPSVR2排第三,ValveIndex排第四。
尤其是,Quest2没有上榜,仅列为“荣誉提名”。看到这里,大家应该能感受到这个榜单的含金量了吧。
资本市场对VR行业的兴趣也明显高涨,我们“被迫”提前启动了最新一轮的融资,希望在不久的将来能跟大家分享好消息。
5、正式开场
过去半年中,我们一方面如刚才所说,切身感受到了苹果的VisionPro给行业注入的能量和活力给我们带来的“推背感”,另一方面对空间计算的未来也有了更多的思考。尤其是VisionPro正式发售后,我们第一时间就拿到并做了深入体验、拆解和分析。对其有了更直接和深入的认识。那么今天我们也在完成对VisionPro的初步拆解和分析之后,结合过去半年的思考,第一时间来跟大家分享和交流。
6、空间计算的价值和意义
首先,是一个虽然可能会觉得已经有点不那么新鲜,但是我们觉得还是有必要说的话题,就是我们如何理解空间计算这个概念,以及他的价值和意义。
因为在全球范围内对这个问题并没有统一的共识,我们如何理解这个问题,在很大意义上决定了我们自己的理念和策略。
我们认为:计算升维,对于人类而言意义重大。
人类与世界的交互方式,人类感知世界与处理信息的方式可以认为是三维的,也就是空间的。如果把时间维度也算进去,就是4维的。
人体其实本身是一个非常高级的空间计算“设备”。人,作为一个模拟计算“设备”,输入信号就是各种感官知觉,而人脑则是处理器,使用真正意义上的“神经网络”处理信息并作出决策,进而通过肢体、声带和眼神等器官输出计算结果,并在此基础上形成各种支撑人类生存所需要的各种人类活动,比如狩猎、社交、进食、繁衍、游戏等等。
由于人的感知器官的感知距离局限,人作为“空间计算单元”,只能跟当下(时间维度)眼前的(空间维度)现实世界进行高效的互动(就是上述支撑人类生存所需进行的各种活动)。这就意味着时间和空间上的双重限制,人所拥有的技能和知识也局限于通过本人感知和实践得来的直接知识。
7、“降维建模+升维重建”范式的历史意义和局限
但是,人类之所以能成为地球的主宰物种,核心原因是能够超越基因突变和自然选择的漫长周期的局限,形成了文明并实现文明的快速演进。
人类之所以能做到这一点,其关键则在于间接知识或间接经验的形成和传播。
也就是说,人类形成了对纷繁的现实世界进行模型化(数字,理论,公式等)的能力,基于此形成了知识,并通过各种媒介(文字,图像,纸张等)对知识进行存储与传播,这样人类就有了形成和传播间接知识和体验的手段。在这个基础上,人类开始有能力突破空间和时间维度的局限,和认知和体验远处的人和事物并与之进行互动。
从另一个角度看,这相当于通过技术手段,构建了一个或多个虚拟世界来镜像远处的、甚至是过去(或者未来的)现实世界。这样人就可以突破时间和空间的限制,大大提升了人感知、认知和影响这个世界的能力,并基于此发展出来了人类文明。
尤其是在近现代,借助于科学技术的发展,这样的能力实现了突破性的提升,从而实现了物质财富和科学文化的飞跃式发展。
但是,人类通过感知与实践得来的直接知识,是三维+时间的完整体验,而其作为间接知识形成、记录与传播时,受技术水平所限,多以文字、数字、图片、书本等一、二维为载体体现。文字是一维的,图片是二维的,视频是二维+时间,但无论哪一种载体,相比基于三维的直接知识和经验都是一种降维。而“消费”这些间接知识的过程,则可以视为一个“升维”和“重建”的过程。
这种“降维”再“升维”的努力带来了两方面的效应。
一方面,这种降维需要对现实世界的“模型化”,或者叫”抽象化”,也就是对现实世界中观察到的现象和背后的规律,通过低维度的载体进行有效的表达。这样的努力为我们带来了文字、数字、科学、艺术等人类文明璀璨的结晶,让人类成为了骄傲的“万物之灵”。但是,这种降维本身需要过人的天赋加上高度专业化的训练才能胜任。
第二,传播效率的同时也牺牲了信息密度。在降维的过程中,间接知识损失了许多必要信息,不再能复现完整的直接知识或体验。这导致间接知识和体验的“消费”本身就有了门槛,也需要相当程度的训练才能胜任这种“升维”和“重建”,比如阅读文字、理解公式、审读图纸等等。
基于这样的分析框架,我们可以很容易理解“升维”的重要意义。
以三维信息作为载体最接近人类的真实体验,符合人类跟现实世界的交互习惯,相比二维信息显著提升了传播效率与传播精度,将间接知识传播过程中在形成与传播的过程中的损耗降至最低,也将显著降低人“生产”和“消费”间接知识的专业门槛。
也就是说,有了空间计算,我们通过技术则可以构建出“非维度压缩”的、“更加真实”的虚拟世界,则可以在真正意义上“镜像”甚至“增强”远处、甚至是过去(或者未来的)现实世界。而人可以使用与生俱来的和现实世界交互的方式,更加自然地和这些虚拟世界交互,其交互效率将有巨大的提升,从而进一步提升人感知、认知和影响现实世界的能力。
这有助于提升全人类文明的进步效率,甚至从根本上改变人和现实世界的关系。
下面我们举两个例子来进一步说明。
8、升维在CAD领域的意义
电子计算机可以看做是人脑的延伸,将信息、知识、文化首先进行“抽象化”,并以计算机能够理解的语言和方式进行处理,成为人类重要的生产工具。但计算机的使用仍然是有很高门槛的,核心的原因是上述的“抽象化”导致的信息降维。最早的计算机是服务于科研人员及军事领域的实验室产品,用户通过命令行和编程语言和计算机进行交互,需要长时间的专业训练才能胜任。
图形界面取代代码命令后,二维的图文相比一维的代码更易为用户理解,计算机也逐渐走入寻常百姓家。从一维到二维(属于平面计算的范畴),计算机完成了普及的使命——一般的用户可以无障碍完成基础操作,经过训练的用户可以使用各种计算机软件完成更高阶操作,如制图、建模、开发等。
那么,再从二维到三维(也就是从平面计算到空间计算),我们认为这种放大效应将更加显著。仅以以面向物理实体的工程制图为例,最终的呈现效果其实是取决于“创意本身”以及“使用将创意复现在图纸上”两大层面。绝大多数工程(以机械和建筑工程为主)实体是三维的。为了更高效的存储、传输和修改工程设计相关的信息,前辈们最早是通过做缩微模型的方法来存储这些信息(举例:样式雷),但是大家显然可以想象这这种方法的效率之低下。
后来思路转到了“降维”的路上来,也就是把三维的信息转移到二维的媒介(主要是纸张)之上。
基于“降维”的思路,很多种方法被尝试,这些方法各有优劣,直到1795年法国科学家加斯帕·蒙日将各种表达方法归纳,发表了《画法几何》著作,核心理念是把三维的实体投影到多个二维的平面。大多数工科的同学在大学学习的《工程制图》就来源于此。
蒙日方法对在科技界、尤其在工程界得到广泛的应用,在人类近现代物质文明的高速发展中起到了重大的作用。但是这套方法需要长时间的系统专业训练才能完全掌握。
即使到了计算机时代,有了3D建模工具,我们仍然不得不把3D的模型投影到2D的平面屏幕上展示,用户仍然需要相当程度的训练和空间想象和思维能力才能有效的驾驭这些工具。
但是在空间计算时代,我们不妨想象一下戴上MR眼镜在空间计算平台进行工程设计的场景,在三维空间构建实体模型,一切将变得直观且立体,用户可以更加专注于“创意本身”,用户专业度门槛将大幅降低,用户使用计算机的可处理对象将进一步扩充,与计算机的交互效率也将进一步提升,可以释放出来的生产力不可限量。
9、升维在游戏领域的意义
在游戏领域,这个逻辑也完全成立。
这个图片我不说是什么,估计在座各位可能都想不到,这是一个游戏的界面。最早的网游,MUD游戏的界面,就长这个样子。
看到这个界面,大家应该可以想象这种游戏的用户规模和市场规模是怎样一个概念。
从这种基于文字的一维游戏,到基于平面图像的二维游戏,到基于2D的“子画面”拼接的“伪”3D或者叫2.5D游戏,一直到所谓“真”3D游戏。
目前电子游戏市场已经是一个有10亿用户群体,总营收2400亿美元,相关上市公司市值超过2万亿美元的巨型市场。其中3D类型的游戏占到80%以上。
计算升维在这个过程中扮演的角色我想不再需要更多的解读。
但是,请注意刚刚我说的是“所谓”的“真”3D游戏,因为即使是计算机内的模型已经是真正的3D,但是在VR出现之前,用户还是需要通过一个2D的屏幕跟游戏世界去交互,沉浸体验会大打折扣。
为了更好的说明这一点,我用最近爆火的UEVR来说明。UEVR,就是UnrealEngineVR。UnrealEngine,虚幻引擎,是目前电子开发中最常用的两款引擎之一(另一款是Unity)。
UEVR作为一款开源的工具,不包括任何代码、配置文件或对单个游戏的定制设计。几乎可以让所有基于虚幻引擎近期版本开发的游戏都能在主流VR头显上体验,理论上支持Steam上超过11,000款的虚幻引擎游戏。
也就是说,UEVR的出现,让上万款使用虚幻引擎开发的游戏都有机会实现最简单的“VR视觉化”,玩家佩戴VR头显便能从与以往不同的视角进行游戏,从而获得新鲜的体验。
为什么UEVR可以做到这一点?就是因为在计算机内,这些游戏已经是真正的3D。再加上真3D的交互界面,也就是VR,这些游戏马上就可以变成全沉浸的VR游戏。
刚刚我用了两个我们看得见摸得着的例子,分别是AutoCAD和游戏,来说计算升维,也就是空间计算的意义。
10、元宇宙VS空间计算
从更长远的角度看,计算升维则是人类实现超越现实时空限制的生存方式之亘古梦想的必经之路。
当然,具体实现的路径不同公司有不同的看法。
在Meta所构筑的元宇宙理想中,人是直接可以在虚拟世界当中生存的,虚拟世界是可以有无限多个的,而现实世界只有一个,甚至可以认为是虚拟世界的一个实例,因此在理论层面,虚拟世界的概念比现实世界更高一级。
但在苹果的空间计算逻辑中更加以“现实”中的人为本,其现实世界与虚拟世界几乎是同等重要的关系,在某种意义上现实世界比虚拟世界更加重要。
为了实现这样的愿景,AppleVisionPro通过VST(视频透视)技术,将虚拟的物体叠加于“增强”了的现实世界之上,将虚拟世界视作现实世界的扩展和补充。
其一方面是在头显中的三维的现实环境中增加二维的多窗口平面显示,核心意义是历史性地突破了个人计算设备中交互效率和贴身性之间的矛盾,稍等我会详细解释这个概念;
另一方面则是脱离二维的显示窗口,在头显里的现实环境中直接展示三维的虚拟物体,使得虚拟世界更好的融入现实世界中。
从这个视角比较,Meta的元宇宙理想或许是更有野心的,但苹果在当下更好地实现了现实与理想的平衡,更具商业上的可行性。
11、交互效率和贴身性之间的矛盾曲线
刚刚我们提到了核心意义是历史性地突破了个人计算设备中交互效率和贴身性之间的矛盾,下面我来详细解释这个概念。
用户是通过交互界面来使用计算设备,也就是跟计算设备进行交互。
个人计算设备的使用体验,可以通过两个大的维度来衡量,一个是交互效率,通常我们会以“用的爽不爽”来衡量;一个是携带的便利性(或者叫“贴身性”,英文通常用Proximity表示)。
交互效率背后的核心因素又有两个:一个是展示信息量,另外一个是认知负担。
影响展示信息量的主要是是交互界面的面积。
影响认知负担的主要是是否具备支持多任务,是否具备多窗口同时显示。如果这些都没有,我们就需要调用人脑中的短期存储机制来支持不同任务直接的切换,就意味着更高的认知负担,我们在处理稍微复杂一点的任务的时候,就会觉得“用的累”。
(理解了这一点,我们就知道Ctrl+C和Ctrl+V是多么伟大的发明。这个图是一个仅有三个键的键盘,据说很好用)。
为了提升交互效率,我们通常会选择加大屏幕的面积,提升计算机的综合处理能力以支持多任务处理。
但是,带来的负面效应就是设备的便携性就会变得很差。
另外一个方向,就是提升设备的便携性。随着微处理器能力越来越强,我们可以把个人计算设备做的越来越小,也是就是说贴身性越来越好,甚至像耳机一样,不止是贴身,都已经进入到我们的耳道。但是不可避免的,交互面积越来越小,交互效率越来越低。
所以我们就会看到这样一条约束曲线,个人计算设备的交互效率和贴身性,两方面此消彼长,形成一条反比曲线。从个人电脑出现到目前为止的所有设备,都摆脱不了这条曲线的约束。
但是,苹果的空间计算设备以光学成像代替了物理的屏幕直接显示,并且基于强大的底层算力实现了多任务和多窗口显示,从而实现了对这条曲线的历史性突破,第一次同时实现了超高的交互效率和超高的贴身性。
12、苹果空间计算的愿景和能力基础
再回顾一下前面的讨论的结果:在空间计算的框架中,我们通过数字化的技术手段则可以构建出“非维度压缩”的、“更加真实”的虚拟世界,则可以在真正意义上“镜像”甚至“增强”远处、甚至是过去(或者未来的)现实世界,当然也可以对眼前的世界进行数字化的“增强”。
最后的结果都是一个看起来像真实世界的数字化世界。
在这个基础上,人可以使用与生俱来的和眼前的现实世界交互的方式,更加自然地和这些数字化的“世界”交互。
这些数字化的“世界”是现实和虚拟的融合,其融合的比例是连续可调的。
一个极端是完全还原眼前真实的世界,另外一端则是完全虚拟的世界。中间则是不同比例的融合,这个融合的比例在某种意义上是连续可调的(苹果VisionPro上就有这样一个旋钮)。
用户可以自己选择:或者是站在真实现实的基础上,去尝试更多的虚拟世界的可能性,或者是选择在通往“全虚拟”的元宇宙的道路上走的更远。
为了达到这样一个愿景,需要两方面的基础能力。一方面是“现实虚拟化”,另一方则是“虚拟现实化”。
对应到我们可以看到的产品层面,现实虚拟化其实就是VST,虚拟现实化其实就是VR。
所以我们一直说,VisionPro的本质就是一台带有高性能VST功能的高端VR头显,现在这也已经是全行业的基本共识。
但是,一度在相当长一段时间内,这个结论其实充满了争议,甚至很多AR眼镜厂商坚持认为VisionPro的发布代表了AR眼镜市场的爆发机会。为什么?
13、AR场景vsAR眼镜
核心原因,是苹果不愿意把VisionPro叫成VR。在苹果零售店店员的培训中,苹果禁止店员把这台设备称为VR,但是叫AR或者MR是OK的。
因为TimCook一直以来,都认为苹果的产品是为了让用户在不脱离真实世界的基本构建元素的基础上,能体验到更美好、更具生产效率、和更丰富多彩的生活。那我们不得不承认,用“AugmentedRealty”来描述这种愿景,的确比VirtualReality要贴切。
但是,为什么苹果在构思这款所谓的AR产品的基本技术架构的时候,选择了用VR作为技术基底呢?
我们认为,其核心原因是为了实现“现实虚拟化”,必须要选择VST,而不是OST的方案。
下面我展开讲一下两者之间的区别。
14、OSTvsVST
传统意义上的AR眼镜公司所采用的是OpticalSeeThrough,即OST方案,是指周围环境反射的可见光穿过镜片直接进入人眼成像,虚拟物体则直接显示在在半透明的近眼显示屏幕上,两者叠加形成虚实结合的效果。
OST方案从理论上可以做的更轻便,更接近常见的眼镜,但其本质特点是较小的视场角内的数字化生成的虚拟物体直接叠加在人眼自然视觉所感知的真实环境之上,在光影处理的一致性和精确定位对齐等方面存在极难逾越的技术障碍,无法真正实现虚实“无缝”融合的效果。
而VST模式则可以把周围环境的信息全面采集,经过处理实现了“现实世界的虚拟化”之后,再和虚拟的物体实现无缝的结合,再统一展示在完整的视野中。
这个方案跟OST相比,有如下几方面的优势:
(1)因为对视野中所有的像素点都可以管理,在理论上能保证虚实完美融合的可能性,而OST则不可能做到。这一点我刚才讲过了。
(2)保留了对真实环境进行加工和升级的可能性。举个例子,我在办公的时候,我可能是在一个开放办公区的一个隔间。但是我带上这个头显,周围触手可及的范围内的东西可以真实还原,但是更远处的嘈杂的人和物都可以被一个独享的高级办公室的物件所代替,窗外可以是你喜欢的任何美丽景致。而OST只能“忠实”的让你看到完全真实的世界。
(3)保证了在数字空间中再次传播的一致性,也就是说,本人视野中看到的东西和其分享给别人看的东西可以是完全一致的。这个有点抽象,我再进一步解释一下。在很多场景下,用户需要把他视野中看到的东西和别人分享,在VST模式下,双方看到的东西可以是完全一致的,因为双方看到的都是数字化的内容。但是,在OST模式下,一个人是用肉眼看的,另外一个人看到的是摄像头拍下来的,两边是不可能完全一致的。
基于以上分析,VST显然是更具通用性和可扩展性的一种模式。
另外很重要的一点,VR加上VST方案可以同时兼容VR和AR两种模式,用户既可以选择现实生活,也可以选择虚拟生活,也可以选择中间的任何一种比例的融合,这显然更符合空间计算的产品理念。而AR眼镜则只能支撑单一的狭义的AR场景。
当然这个VST模式面临的挑战就是对空间感知和处理以及重建能力提出了更高的要求,以及头显的体积和重量会比较大,暂时还做不到类似眼镜的形态。
行业内长期以来存在这两条路线之争。而小派始终认为,VST模式才能真正实现MR,也就是空间计算的愿景。该模式目前面临的挑战比如算力、体积和续航问题,都在随着技术的进步而逐步解决中,但是OST模式有其底层产品逻辑上的致命缺陷,无法支持通用MR的未来。
我们很高兴看到,苹果推出的VisionPro,是采用了VR+VST的技术路线,跟小派一直以来坚持的方向是一致的。
我们虽然无从得知他们整个决策的过程的细节,但是可以想象,必然是经过了深思熟虑的论证,以及多条技术路线的赛马机制,最后做出了这样的决策。
我们可以认为,在这个世界上,没有一个组织在这样的一个论证的过程中所能调动的智力资源和财务资源能跟苹果相比。因此苹果做出的这个决策,其背后的技术和商业合理性有极大概率是目前存在的最优解,也必然将在相当长时间内代表通用MR产品的核心形态和技术路线。
除了从逻辑的层面去尝试复现苹果的决策过程,我们还要考虑到苹果的强大的市场地位,和随之而来的对产业方向的强大的引领和塑造能力。
也就是说,苹果不但能够更好的预测未来,还能更好的打造未来。整个个人计算行业40年发展的历程,一再证明了这一点。
15、卷像素
说完了“现实虚拟化”,我们下一步来讨论“虚拟现实化”,那也就是VirtualReality.
在VR这个方面,VisionPro给行业带来的最大的变化,简单说就是三个字:卷像素。
在VisionPro之前的消费VR领域,小派头显产品在很长一段时间内都是全球总像素数最高的产品,1659万像素,大家可能对这个没有特别的概念,市场上大家耳熟能详的主流厂商的产品基本上都在900万像素左右。
而苹果的VisionPro把这个记录提升到了2300万像素。
高分辨率在工程上带来了很多的挑战。无论是计算、传输、显示和冷却,所有这些环节都意味着更大的负担,也必须用更强的能力去处理和应对相关的需求。体积、重量、能耗和主动散热都是要在工程上付出的代价。更不用说在BOM成本和价格上的直接影响。
在对VisionPro的诸多负面评价中,一个是重,一个是贵,这显然都是跟高像素息息相关的。
为什么苹果宁可付出这样的代价,还是要坚持把像素值提到这样高的水平呢?
核心原因就是因为他们认为,这是足够好的“虚拟现实化”水平所必需的。
在保证足够高的刷新率和足够低的延迟的前提下,决定VR视觉沉浸感的最重要两项指标分别是PPD和FOV。其中PPD决定了视觉所能感知的清晰度,而FOV决定了视觉所能感知的范围。暂且不考虑单眼FOV和双眼FOV之间关系的情况下,我们可以简化的认为,PPD乘以单眼FOV恰好就是单边像素的总数。
因此,我们可以说,在很大的意义上,VR头显的总像素数决定了其向用户提供的沉浸感的水平,至少在行业发展的目前这个阶段,因为在这个阶段,整个VR行业,哪怕是小派和苹果这样在性能指标上最领先的公司,给用户提供的沉浸感水平还是不足够好的,因此在分辨率上每一步的提升,都会带来沉浸感上的显著边际提升,对行业的发展有重要的意义。这是小派一直以来坚持不懈地努力提升VR头显产品的分辨率边界背后的逻辑。
但是在很长一段时间内,市场内大多数厂商还是在900万像素的水平上徘徊不前,其背后当然有他们的诸多考虑,在某种意义上也是整个VR行业的发展速度不尽如人意的底层原因。我们很高兴的看到,苹果的VisionPro在像素数上的理念和小派是完全一致的。
这从苹果把这台机器命名为Vision就可以看出来,苹果对视觉沉浸感的重视程度。无独有偶,小派的第一代8K产品的系列代号也是Vision。
总结一下,“卷像素”是VR行业发展的正确道路,也是空间计算发展的正确道路,也是小派擅长的、并且一直坚持的道路。苹果VisionPro的发布,把行业带到了这条正确的道路上来。
16、关于VR3.0
像素数直接影响的是视觉沉浸感,但是对高性能的VR体验来说,视觉沉浸感还不是全部。
早在2021年,我们小派就提出了VR3.0的概念,对高性能VR应该具备什么样的功能和性能做出了定义,这也是我们在定义自己的产品路线图的时候所依据的理论框架。
关于视觉沉浸感,刚才我已经讲过,核心是卷像素。
关于物理沉浸感:
VR硬件需做到头手6DOF精确定位(sixdegrees-of-freedomtracking),即头和双手的三个位移自由度和三个角度自由度定位追踪,同时设备需在无线化、体感反馈、人体工程学设计等方面进行足够优化。在VR2.0时期,定位方案主要为outside-in,其方案好处是定位精确,缺点是价格比较高,需要配两个灯塔基站,移动非常不灵活;基于计算机视觉的inside-out定位方案是目前主流的发展方向,它的精确度足够高、价格便宜、使用便捷,而且基于这些拥有于定位的摄像头衍生出了VideoSeeThru功能,已经具备了一定的MR能力。
关于认知沉浸感:
对认知沉浸感进行评判通常基于MirrorTest。其被用作测试动物是否足够聪明能知道镜子里的图像是自己而不是其他个体。我们借用这个概念,意指在VR的镜子里是否能看到自己的表情、眼神、全身和动作,以形成足够真实的自我存在感,而不是“漂浮在虚拟空间中、看不到自己身体的魂灵”。这除了上边说的头手6DOF的跟踪定位之外,还需要facetracking(面部追踪)、eyetracking(眼部追踪)及bodytracking(全身动作捕捉)甚至情绪跟踪等诸多功能的支持。只有在充分的认知沉浸感的支持下,才有可能在VR中形成真正有效的社交场景。
17、PimaxCrystalvsVisionPro:视觉沉浸
视觉沉浸
- PimaxCrystal
- 视觉参数:35PPDx120FOVx120RFR
- 屏幕透镜:2x4KminiLED+非球面玻璃透镜
- VST:通过定位摄像头实现的透视,将通过MR面板升级至全彩透视
AppleVisionPro
- 视觉参数:34PPDx110FOVx100RFR
- 屏幕透镜:2x4KmicroOLED+Pancake3P透镜
- VST:通过双650万像素摄像头实现的全彩透视
18、PimaxCrystalvsVisionPro:物理沉浸
物理沉浸
- PimaxCrystal
- 定位:Inside-out定位技术支持6DOF头手定位
- 便携:有线缆「PCVR模式」,支持无线模式(Wi-Fi6E+WiGig),重量845g
AppleVisionPro
- 定位:Inside-out定位技术支持6DOF头手定位
- 便携:有线缆「外置电池」,仅支持Wi-Fi6,重量1000g(650头显+350电池)
19、PimaxCrystalvsVisionPro:认知沉浸
PimaxCrsytal
- 动作捕捉:支持眼动追踪(原生),手部追踪(额外模组)
- 支持杜比DTS音效
AppleVisionPro
- 动作捕捉:支持眼动追踪、手部追踪、表情识别(原生)
- 支持空间音频
20、PimaxCrystalvsVisionPro:不谋而合
说到这里,大家可能应该能够清晰的感知到,小派一直以来坚持的产品理念和苹果的空间计算的理念之间有非常高的重合度。
也就是我们上次见面会的主题:高性能VR是切入空间计算的技术基底。
小派多年来坚持的高性能VR之路在很长一段时间内不被认为是行业的主流,在苹果的VisionPro发布之后,一切都改变了。
小派目前的旗舰产品PimaxCrystal在近期频频被海外主流行业媒体作为苹果VisionPro的可比产品推荐和报道。
在国内国投证券最近的一份研究报告中,以苹果VisionPro的核心功能和性能为标杆,对全球市场上主要的VR厂商的空间计算产品力进行了评分,从高到低依次为Apple(10.0)、Pimax(5.9)、Meta(5.0)、Varjo(4.5)、PICO(4.4)、HTC(4.3)、DPVR(3.5)、YVR(3.5)、Valve(3.2)。
小派在苹果之外的所有厂家中,所获评分最高。
但是,我们也清醒的看到,小派即使相对排名最高,但是得分也还是差一点点没有到及格线。这个分差反映了什么?
我们认为:一方面是差异,一方面是差距。我下面分别仔细展开讲。
21、差异:封闭生态VS开放生态
所谓差异,就是根据自己在行业所处的不同生态位主动做出的战略选择方面的差异。
首先从目标场景谈起。
苹果VisionPro针对的场景是:生产力和轻娱乐。
小派针对的主要场景则是:游戏、轻娱乐以及垂直商业应用。
苹果选择生产力和轻娱乐并不令人意外,这是苹果一直以来的市场定位。这既一方面反映了苹果在产品方面的价值观;更重要的是,苹果有意愿、有能力独自培育和支撑一个完整的内容生态体系。也就是说,苹果可以主动的选择去面向哪个市场,哪个用户群体提供产品和服务。
但是对小派来说,我们作为一个初创企业,不可能去copy苹果的策略,去独立打造一个从芯片到整机、一直到应用和内容生态的完整的封闭体系。
不止是小派做不到这一点,全世界在苹果之外到目前为止也没有一个企业能做到这一点。
我们的策略则是:在开放生态体系中,选择配套环节发展最为成熟的场景,扮演好我们该扮演好的角色,跟市场上的合作伙伴一起服务好我们的客户。
我们目前针对三个场景:最重要的是游戏,其次是轻娱乐和垂直商业应用。其背后的核心逻辑,核心就是两个字:开放,也就是要充分利用开放体系的优势。
22、关于游戏场景:空间有限?莫大的误会
在SteamVR平台上,就有超过5000款为VR开发的应用,其中大部分是游戏,也有一些面向生产力和影音娱乐的应用。
这些应用绝大多数不需要做任何改动,就可以被小派头显的用户所享用。
如果觉得这还不够,前边我讲的UEVR,可以让Steam上11000款基于UnrealEngine开发的应用瞬间变成VR应用,都可以被小派头显的用户所享用。
也就是说,单单在Steam平台上,就有16000款应用可以被小派头显的用户所使用,而小派不用为这些应用的开发付出任何成本。
这就是开放体系的魅力。
也有些人会觉得游戏的市场空间有限。但这其实是个莫大的误会。
我从三个方面来讲:
(1)前边在讲计算升维的时候讲过:游戏行业全球有10亿活跃用户,年度总收入超过2400亿美元,相关上市公司总市值超过2万亿美元。这是个巨型市场,是非常广阔的天地。
(2)历史上游戏产业作为科技创新的“试验场”,借助游戏产业的庞大用户群体和活跃的市场需求,能够为科技创新提供充足的商业资源和更早的试错机会,多次助力科技成果走出创新的“死亡之谷”,降低了科技创新的试错成本。因此,小派现在专注游戏场景和未来面向通用个人计算平台之间完全不矛盾。
(3)对小派而言,游戏市场还有一个巨大的好处就是:基于多种原因,封闭的Mac平台历来不是游戏用户的首选,而开放的Wintel体系中则是游戏用户的乐园。VisionPro则干脆连绝大多数VR游戏的“刚需”也就是手柄都直接取消了,几乎可以说是完全“无视”了游戏用户的需求。因此小派选择主打游戏领域,完全不会跟苹果VisionPro形成竞争关系,相反,体验过苹果VisionPro之后的游戏用户,想在Wintel体系中寻找同等水平的VR体验,小派是为数不多的选项中最具竞争力的一个。
23、其他开放场景:轻娱乐和垂直商业应用
其次,关于轻娱乐,其实就是影音娱乐。尤其是空间视频,这个场景其实是很多人在想到VR的时候首先想到的场景,也是很多人首次体验VR时的场景。
但是,到目前为止,基于VR的沉浸式影视内容还没有成为一直主流的内容形态,其背后的原因有多种,最重要的一点、也是这个领域发展的核心瓶颈,是主流VR头显的PPD不够高。
VR头显的PPD不够高,导致用户在看VR视频内容的时候不够清晰,观看体验会大幅的降低。内容创作者恰恰是对视觉效果要求最高的一个群体,看到他们精心制作的内容在VR头显里以极低的分辨率播放,而且得不到观众群体的认可,对他们的创作热情和商业上的可持续性都是极大的打击,因此就不再有人努力制作高质量的VR影视作品。
这就导致,小派Crystal的高PPD本来可以让观影体验大幅提升,但是又很难找到真正能体现出高PPD优势的片源。
而苹果的高清晰度空间视频的体验以及在最新iPhone上提供空间视频拍摄功能,会在很大程度上消除VR视频类内容发展的瓶颈,从而释放整个行业的能量,极大地促进沉浸式影视内容的发展。这对小派Crystal的用户中对观影功能比较看重的用户来说,是个极大的好消息。
影音内容的另一大特点就是开放性强,不同格式和播放平台之间的转换的门槛很低,因此苹果对空间视频领域的引领和促进效应,会很快解决小派用户所面临的“内容荒”的问题。
第三个场景,垂直商业应用。很多含金量很高的垂直商业应用场景对VR头显的性能要求很高,对价格不敏感,因此小派的头显在这些领域很有优势。而且这些行业的特点就是,有很多专注特定行业的专业方案商,不需要小派自行开发针对行业的解决方案。小派要做的就是利用小派产品的功能和性能优势,更好的赋能这些合作伙伴,帮助他们更好的他们面对的行业和客户。这同样是开放体系中分工合作的魅力。
24、差距及应对策略
差距,跟差异不同,是指我们在能力方面和苹果相比存在的客观不足。
这个差距显然是巨大的,也是多方面的。
但是这里我不会展开讲这所有的方面,而是专注在底层技术上,去比较苹果自有的技术栈的能力,和开放体系的技术栈的能力,两者之间的差距,以及反映在产品设计上的差别。
核心是两个字:算力。
最近大家可能都被英伟达市值超过2万亿刷屏。因为,算力是AIGC领域最稀缺的资源。但是这是从可用的总量来说。
在VR领域,单片GPU的能力在很大程度上决定了头显设备的很多参数。
苹果之所以能够用一台一体机(暂且不考虑分体的电池),支撑8K级别的显示,以及流畅的多任务执行和多窗口显示,是因为他们把一片高端笔记本级别的SoC芯片M2塞进了VR头显中;而他们的VST之所以能够做到高清和低噪点的同时,保证12毫秒的超低延迟,是因为他们为这个场景专门研发的R1芯片。
而市场上其他的一体机,目前还只能用移动级别的芯片,来支撑4K级别的显示效果。虽然移动级别的芯片经过针对XR场景的能力优化,并通过迭代升级,已经有了很大的提升,但是要想匹配VisionPro的效果,无论是在芯片端的能力优化,还是在软件端的算力利用率优化,还有大量的工作要做。
因此要匹配VisionPro的水平,在目前这个阶段,最有效的方法其实是用PCVR方案,也就是说,直接使用PC级别的独立显卡和CPU的算力,其能力是很显然要高于被塞到头显的狭小空间中、散热条件很差的SOC芯片M2。
这其实是小派头显能够相对轻松的匹配苹果头显的显示效果,在很多方面甚至要超过VisionPro的原因。我们今天的体验中大家应该也能直观地感受到这一点。
当然,芯片提供的“生”算力是一个基础,但是并不是全部。即使是在PCVR这个领域,大家都可以使用到英伟达或者AMD独立显卡的算力,能够有效的提供8K级别头显的厂商也是凤毛麟角。
这其中牵扯到的技术壁垒远比想象中要高,而小派在这个领域有长达8年的不间断的积累,这在整个行业是独一无二的。
而这些技术在很长时间内被认为是“屠龙之术”,虽然很厉害,但是商业价值没有充分体现。因为VR市场,无论是消费需求,还是话语权,很长时间内被低性能低价的VR头显品牌所把持,大家对高端VR头显始终没有重视起来。而VisionPro让高性能VR成为了市场“主流”之一,但是高端VR的研发的门槛却不是那么容易跨越的。
当然,很多人会问:为什么苹果的芯片这么厉害?一个SoC芯片中的GPU就能够跟PC中的独立显卡平起平坐,分庭抗礼?
这就牵扯到前边我们已经提及的一个非常有意思的话题:开放和封闭。这里我再展开讲一下。
25、封闭的优势VS开放的机会
我先回答一下我们刚刚提出的问题:苹果之所以能把芯片的效率做的这么高,核心原因是因为他们的技术体系是封闭的,也就是说,他们只在设计芯片的时候,不需要考虑广泛的兼容性,也就不需要为此付出相应的成本,这样效率就会高很多。而独立的芯片厂商则没有这样的优势条件,在最终展示出来的性能上肯定就会吃亏。而广泛的兼容性对整个行业来说显然也有巨大的价值。因此这不是一个完全公平的比较。
但是,M2终究还是一款笔记本芯片,它的图形处理能力大致相当于目前市场上中端的独立显卡的能力,跟桌面电脑最先进的独立显卡的算力还是有明显差别的,所以我们的PimaxCrystal匹配上高端独立显卡作为图形渲染能力基础,再加上高通的XR芯片的算力提供对辅助功能的支持,整体上的算力其实是显著强于VisionPro的,所以在VR方面最终体现出来的功能是的综合性能是要强于苹果的。
那既然讲到这个开发与封闭的话题,就多说几句。
最近有一个非常有意思的新闻,就是扎克伯克发了一条视频点评VisionPro。
绝大多数媒体关注的点都是,小扎说“Quest3就是比VisionPro好”!
针对这个点说的人够多了,我们就不去评价了。
这里更值得回味的是他的另外一段话:“事实是,每一代的计算平台都有开放和封闭的模式。在移动领域,苹果的封闭模式在某种意义上胜出了,但这并不代表任何规律性的东西。如果回溯到PC时代,微软的开放模式就是赢家。在我们目前面临的下一代(个人计算平台)中,Meta将是开放模式,我会努力保证开放模式再次取得胜利。”
小扎这段话确实是对的,开放模式自有其强大的生命力和巨大的空间。即使在小扎认为苹果封闭模式胜出的智能手机领域,基于安卓的开放世界还是有80%的出货量和50%的营收比例。更不用说在PC领域,苹果仅占有10%左右的市场份额。
空间计算时代,虽然苹果又一次定义和引领了市场,而且必然在未来占据相当一部分市场份额。但是,同样确定的是:苹果的封闭世界之外,一定会存在一个更大的开放世界。
那下一个自然而然的问题就是:在空间计算时代的开放世界中,机会会留给谁呢?
26、小派在空间计算领域的优势
答案自然是:机会永远是留给有准备的人。
小派为这个机会已经准备了八年时间,而且,一直在坚持走的就是今天苹果所选择的道路。
这也反映在前面提到的国投证券报告的研究结果中。
注意这个报告并没有包含AR眼镜厂商,我们认为其背后的原因也很简单。
因为,在目前行业普遍认知的“空间计算”概念中,也就是苹果所定义的“空间计算”概念中,并没有OST,也就是光学透视的位置,自然和基于OST架构的AR眼镜就没有什么关系了。
在VR+VST这个阵营中,我们认为国投证券的研究结果相对准确地反映了目前市场上的多家VR厂商的产品的“空间计算准备度”,而小派是其中产品准备度最高的厂商。
小派在正确的时间站在了正确的位置上。我们将在空间计算的大时代,在广阔的开放市场中中扮演关键的角色,取得我们应得的份额和地位。