[导读] Rokid创始人兼CEO Misa写下了这篇号称是“0技术含量”的文章,希望每个人都能读得懂,并形成自己对AR的认识和看法。
CES刚刚落下帷幕,媒体和行业关于AR的讨论非常热烈。作为技术小白,当我们参与讨论AR技术和产品的时候,应该关注哪些重点?
Rokid创始人兼CEO Misa写下了这篇号称是“0技术含量”的文章,希望每个人都能读得懂,并形成自己对AR的认识和看法。
以下,相信你能看懂,Enjoy:
毫无疑问,今年AR(增强现实)技术和产品将回归大家的视野。
说“回归”是因为几年前当Google Glass出现的时候,所有人都为之兴奋了好一阵,令人失望的是不久这个产品也迅速黯淡了(实际上有一些垂直领域至今还在使用这个产品)。
这个被很多人看作有机会取代手机的方向,到底是一个什么概念?或者有什么值得大家思考和关注的?
我打算用这篇小文章来谈谈我们的看法和实践。
首先,今天对AR的描述有很多更细分的说法,比如以光场技术为突破点的,或更注重现实世界物理空间融合的MR(混合现实)等,这里我们不做细节区分,就都叫AR吧。此外,AR在物理形态上可以是手机/头盔/眼镜等不同载体,这里主要阐述眼镜形态。
如标题所言,为了便于启发大家思考,本文不涉及任何技术原理方面的东西,放心阅读。
从AR诞生之日,就有两条明显的路线:信息工具路线和内容娱乐路线。
这个两条路线本质上和技术无关,主要是基于基本的技术原理,落地到两类截然不同的方向,当然也必定导致产品形态以及细节技术路线的差别。其实简单按两类路线去定义产品依然太粗,几乎无法落地到具体产品形态,这一点很多人没有意识到。
AR产品主要有几个大的指标是无法回避的,包括:可佩戴性、单眼/双眼、是否3D、色彩、视野大小(一般用FOV/视场角来描述)、虚像成像距离(VID)、光效率、分体/一体、同步定位和环境重建(SLAM)等主要元素。不用被这些名词吓到,接下来会一一解释,耐心看大家就明白了。
当前AR眼镜有很多实现技术,比如棱镜反射、Birdbath、自由曲面、光栅光波导、衍射光波导等等,这篇文章我不深入解释每个技术,会安排另外一篇叫“一篇关于AR眼镜高技术含量的文章”的文章给大家详细阐述。
有一点需要注意,刚才提到的这些技术各自都有自己的优缺点,我们不能离开场景和产品定位来谈技术的优缺点,这是Rokid公司思考问题的方式,在经过早期研究阶段后,我们一般是先回答场景和产品定位问题,再思考技术选型和突破方向。
现在让我们一个个来看:
1、双眼比单眼好?
第一个问题似乎比较简单,对单眼的否定大部分来自Google Glass第一批用户的吐槽,当时糟糕的体验实在太深入人心,实际上受当时技术限制Google Glass谈不上真的AR,和物理世界几乎是不融合的,可以理解为在你的右眼右上角挂了一个小屏幕,来回对焦和左右眼协同非常幸苦。
实际上很多问题和单双眼无关,主要是由于视线偏离和反复对焦导致的双眼协同问题让人不舒服。
近些年光学成像技术有很多突破,基本上能保证数字图像展现和现实世界视线一致,成像距离也基本能做到不用反复对焦,双眼协同基本没不舒服,而且人的大脑对这样的情况其实并不拒绝,如果产品设计到位,有的人甚至分辨不出是单眼还是双眼。
双目的优势明显,在双眼都收到信息的情况下,立体空间感更容易展现,视野容易做大,成像距离也比较容易被感知到,尤其是对3D效果必须的场景(比如空间建模/立体游戏等),双目是基本配置。
不过是不是都做双眼就好了呢?
这里也有一个不被认知的问题:在双眼模式下,每只眼睛看到独立的显示,其实很难做对齐和焦距自然重合(用过双筒望远镜的朋友就有体会了)。
在无校准对齐的情况下,大脑会发现两只眼睛收到的数字图像,并不在一个自然成像焦距上,然后大脑会大量计算纠错来适应这样的情况,这个是很多双目系统导致晕眩恶心的原因之一(晕眩恶心还有其他原因,比如延时,体态视觉感受不一致等)。
而相反,单眼模式下,另一个眼睛什么数字图像信息都没有,大脑参与工作大大减少,反而不是坏事。
这就是为什么很多高强度、长时间佩戴的AR设备都是单眼,比如飞行员头盔上的AR系统。所以说根据不同场景需求选择不同的方案才是明智的,况且还牵涉功耗/发热/结构复杂度/成本等诸多因素,产品经理和用户都要认真想想,什么适合自己。
2、视野越大越好?
似乎也是一个简单的问题,当然越大越好,这个结论倒是简单,不过核心是视野大小也和功耗,技术复杂度和成本直接有关,如果用途就是简单的信息提示,就没必要太过追求这个(比如最近亚马逊推出的AR眼镜,其实视野很小),颜色其实也是一样的道理。
另外大家也要注意,和VR的沉浸式要求不同,AR场景人的视野天然被现实世界充满,无需刻意充满视觉感受,用户界面上技巧设计,可以模糊视野边界,这是对设计师特别不一样的要求,Rokid很多参与眼镜项目的设计师都感觉进入一个全新的设计模式。
3、成像距离越远越好?
人眼看事物时,会根据物体的不同距离来调节瞳孔聚集来看清东西,而数字成像往往是设计成相对固定的距离,也就是说,当你看这些数字信息的时候,瞳孔对焦是固定的。
由于AR是和现实世界融合的体验,所以当你眼睛看不同距离的东西时候,数字图像就很难保持清晰,这个现象越靠近眼睛越明显。
理想的设计就是跟随眼睛真实对焦情况去控制数字成像的距离,这就是大家说的“光场”技术的目的。
大家有兴趣可以关注我们这次CES展出的一个技术研究成果,能够根据肉眼焦距无极调节数字图像成像距离。
但是,目前的方案成本很高,还不成熟,妥协的方案是在远处/近处各有一个固定距离的成像机构,来尽量适应人眼远近的调节(比如Magic Leap)。
顺便提一下,一般来说MR多指具备这样调节数字图像成像距离技术的产品,但是现在很多厂家所谓的MR产品并不具备,仍然是单一固定成像距离,这就是为什么Rokid并不赶时髦说自己是MR产品的原因。
既然目前大部分产品不具备这样的能力,那么如何设计成像距离就很重要,你的主要场景是看远处(比如开车,要尽量保持聚焦在远处路面),还是看近处(比如看书/绘本内容叠加)决定了你的产品设计,这没有绝对的好坏,当然,现在的产品基本还是默认设计成2-6米之间,希望尽可能通用。
3、光效率,一个被大家忽略的重点
我发现身边大部分人不了解光效率的重要性,光效率包括两个方面,一个是数字图像从出发点到达视网膜的效率,一个是外部现实世界到达视网膜的效率,理论上说,两个都越大越好。
但实际上做不到,不同数字成像光学技术光效率差别很大,由于发光源能量受限(功耗、电池续航、发热诸多因素决定),还有在光路上的不可避免的损失,一般数字图像到达人眼视网膜都有比较多的损失,所以往往需要做一些取舍。
到底更强调外部现实世界的效率还是数字图像效率?
现在很多AR眼镜都在向用户展现数字图像的体验,为了加强这个,往往把外部镜片变成深色,遮挡大部分外部世界光,以免太干扰数字图像(因为亮度不够)。这个如果用在内容展示,当然没问题,但是如果用在和外部世界强交互的时候就是灾难了,有的甚至无法在傍晚和阴天使用。
光效率还直接影响功耗和电池续航力,这个也是非常重要的决策因素。不同技术的光效率差别,几乎是由该技术原理决定的,具体是什么情况,以后在技术性文章里阐述。
4、SLAM需要吗?
这个问题回答起来也不简单,很多设计里,数字图像是在真实物理空间固定位置的,就和真实世界里的东西一样,这样的设计对SLAM(同步定位和环境重建)稳定性要求很高,往往需要多类传感器协作完成。
有的重点只需要做一些头部运动跟踪(比如游戏等),对虚拟物体和现实空间的融合要求不高。还有一些设计干脆就不做SLAM,任何显示就是在你视野正前方,比如一些信息提醒工具类的应用。
SLAM定义主要考虑当前器件的体积大小和计算功耗。总之一切回归场景。
5、一体还是分体?
简单回答,大家都希望在足够轻便,佩戴舒服,续航力又强劲的情况下,做一体机,无需连接外部设备。很可惜,当前技术很难做到。
大部分产品会在第一时间,根据场景决定一体式还是分体式。总体来说依照佩戴舒适度定义是最基本的方法,不过也不完全是,比如分体方式往往需要连线,违反一些安全环境要求,同时也多一些操作步骤。
有的场景则可以牺牲一定的舒适度来保证一体独立计算力,尤其一些专业场景会倾向于一体式(比如美军最近采购Hololens就是牺牲舒适度的),长时间佩戴场景则往往会用分体设计。
Rokid的两款产品是针对不同的场景设计,对于快速行动,即拿即用的场景,我们提供一体式(如Rokid Glass),而对于很多消费者场景,我们也会采用分体设计,保证佩戴舒适度(如Project Aurora)。
通过上面描述,大家可以感受到,抛开场景谈技术好坏是没有意义的,产品设计是一个极其复杂而细致的工作,远远不是一个创意,一个技术就可以完成的事情,需要每天进行很多思考。
AR产品是非常新的事物,即使我们团队潜心研究多年依然有很多问题有待解答,Rokid Lab的科学家和设计师们不断探索研究,不仅仅是基础技术上的突破(材料、光学、结构、电子等),更多的是用户场景和使用体验的研究,而这些都是AR产品走向千家万户的关键。