0技术含量入门一文读懂AR眼镜

[导读] Rokid创始人兼CEO Misa写下了这篇号称是“0技术含量”的文章，希望每个人都能读得懂，并形成自己对AR的认识和看法。

CES刚刚落下帷幕，媒体和行业关于AR的讨论非常热烈。作为技术小白，当我们参与讨论AR技术和产品的时候，应该关注哪些重点？

Rokid创始人兼CEO Misa写下了这篇号称是“0技术含量”的文章，希望每个人都能读得懂，并形成自己对AR的认识和看法。

以下，相信你能看懂，Enjoy：

毫无疑问，今年AR（增强现实）技术和产品将回归大家的视野。

说“回归”是因为几年前当Google Glass出现的时候，所有人都为之兴奋了好一阵，令人失望的是不久这个产品也迅速黯淡了（实际上有一些垂直领域至今还在使用这个产品）。

这个被很多人看作有机会取代手机的方向，到底是一个什么概念？或者有什么值得大家思考和关注的？

我打算用这篇小文章来谈谈我们的看法和实践。

首先，今天对AR的描述有很多更细分的说法，比如以光场技术为突破点的，或更注重现实世界物理空间融合的MR（混合现实）等，这里我们不做细节区分，就都叫AR吧。此外，AR在物理形态上可以是手机/头盔/眼镜等不同载体，这里主要阐述眼镜形态。

如标题所言，为了便于启发大家思考，本文不涉及任何技术原理方面的东西，放心阅读。

从AR诞生之日，就有两条明显的路线：信息工具路线和内容娱乐路线。

这个两条路线本质上和技术无关，主要是基于基本的技术原理，落地到两类截然不同的方向，当然也必定导致产品形态以及细节技术路线的差别。其实简单按两类路线去定义产品依然太粗，几乎无法落地到具体产品形态，这一点很多人没有意识到。

AR产品主要有几个大的指标是无法回避的，包括：可佩戴性、单眼/双眼、是否3D、色彩、视野大小（一般用FOV/视场角来描述）、虚像成像距离（VID）、光效率、分体/一体、同步定位和环境重建（SLAM）等主要元素。不用被这些名词吓到，接下来会一一解释，耐心看大家就明白了。

当前AR眼镜有很多实现技术，比如棱镜反射、Birdbath、自由曲面、光栅光波导、衍射光波导等等，这篇文章我不深入解释每个技术，会安排另外一篇叫“一篇关于AR眼镜高技术含量的文章”的文章给大家详细阐述。

有一点需要注意，刚才提到的这些技术各自都有自己的优缺点，我们不能离开场景和产品定位来谈技术的优缺点，这是Rokid公司思考问题的方式，在经过早期研究阶段后，我们一般是先回答场景和产品定位问题，再思考技术选型和突破方向。

现在让我们一个个来看：

1、双眼比单眼好？

第一个问题似乎比较简单，对单眼的否定大部分来自Google Glass第一批用户的吐槽，当时糟糕的体验实在太深入人心，实际上受当时技术限制Google Glass谈不上真的AR，和物理世界几乎是不融合的，可以理解为在你的右眼右上角挂了一个小屏幕，来回对焦和左右眼协同非常幸苦。

实际上很多问题和单双眼无关，主要是由于视线偏离和反复对焦导致的双眼协同问题让人不舒服。

近些年光学成像技术有很多突破，基本上能保证数字图像展现和现实世界视线一致，成像距离也基本能做到不用反复对焦，双眼协同基本没不舒服，而且人的大脑对这样的情况其实并不拒绝，如果产品设计到位，有的人甚至分辨不出是单眼还是双眼。

双目的优势明显，在双眼都收到信息的情况下，立体空间感更容易展现，视野容易做大，成像距离也比较容易被感知到，尤其是对3D效果必须的场景（比如空间建模/立体游戏等），双目是基本配置。

不过是不是都做双眼就好了呢？

这里也有一个不被认知的问题：在双眼模式下，每只眼睛看到独立的显示，其实很难做对齐和焦距自然重合（用过双筒望远镜的朋友就有体会了）。

在无校准对齐的情况下，大脑会发现两只眼睛收到的数字图像，并不在一个自然成像焦距上，然后大脑会大量计算纠错来适应这样的情况，这个是很多双目系统导致晕眩恶心的原因之一（晕眩恶心还有其他原因，比如延时，体态视觉感受不一致等）。

而相反，单眼模式下，另一个眼睛什么数字图像信息都没有，大脑参与工作大大减少，反而不是坏事。

这就是为什么很多高强度、长时间佩戴的AR设备都是单眼，比如飞行员头盔上的AR系统。所以说根据不同场景需求选择不同的方案才是明智的，况且还牵涉功耗/发热/结构复杂度/成本等诸多因素，产品经理和用户都要认真想想，什么适合自己。

2、视野越大越好？

似乎也是一个简单的问题，当然越大越好，这个结论倒是简单，不过核心是视野大小也和功耗，技术复杂度和成本直接有关，如果用途就是简单的信息提示，就没必要太过追求这个（比如最近亚马逊推出的AR眼镜，其实视野很小），颜色其实也是一样的道理。

另外大家也要注意，和VR的沉浸式要求不同，AR场景人的视野天然被现实世界充满，无需刻意充满视觉感受，用户界面上技巧设计，可以模糊视野边界，这是对设计师特别不一样的要求，Rokid很多参与眼镜项目的设计师都感觉进入一个全新的设计模式。

3、成像距离越远越好？

人眼看事物时，会根据物体的不同距离来调节瞳孔聚集来看清东西，而数字成像往往是设计成相对固定的距离，也就是说，当你看这些数字信息的时候，瞳孔对焦是固定的。

由于AR是和现实世界融合的体验，所以当你眼睛看不同距离的东西时候，数字图像就很难保持清晰，这个现象越靠近眼睛越明显。

理想的设计就是跟随眼睛真实对焦情况去控制数字成像的距离，这就是大家说的“光场”技术的目的。

大家有兴趣可以关注我们这次CES展出的一个技术研究成果，能够根据肉眼焦距无极调节数字图像成像距离。

但是，目前的方案成本很高，还不成熟，妥协的方案是在远处/近处各有一个固定距离的成像机构，来尽量适应人眼远近的调节（比如Magic Leap）。

顺便提一下，一般来说MR多指具备这样调节数字图像成像距离技术的产品，但是现在很多厂家所谓的MR产品并不具备，仍然是单一固定成像距离，这就是为什么Rokid并不赶时髦说自己是MR产品的原因。

既然目前大部分产品不具备这样的能力，那么如何设计成像距离就很重要，你的主要场景是看远处（比如开车，要尽量保持聚焦在远处路面），还是看近处（比如看书/绘本内容叠加）决定了你的产品设计，这没有绝对的好坏，当然，现在的产品基本还是默认设计成2-6米之间，希望尽可能通用。

3、光效率，一个被大家忽略的重点

我发现身边大部分人不了解光效率的重要性，光效率包括两个方面，一个是数字图像从出发点到达视网膜的效率，一个是外部现实世界到达视网膜的效率，理论上说，两个都越大越好。

但实际上做不到，不同数字成像光学技术光效率差别很大，由于发光源能量受限（功耗、电池续航、发热诸多因素决定），还有在光路上的不可避免的损失，一般数字图像到达人眼视网膜都有比较多的损失，所以往往需要做一些取舍。

到底更强调外部现实世界的效率还是数字图像效率？

现在很多AR眼镜都在向用户展现数字图像的体验，为了加强这个，往往把外部镜片变成深色，遮挡大部分外部世界光，以免太干扰数字图像（因为亮度不够）。这个如果用在内容展示，当然没问题，但是如果用在和外部世界强交互的时候就是灾难了，有的甚至无法在傍晚和阴天使用。

光效率还直接影响功耗和电池续航力，这个也是非常重要的决策因素。不同技术的光效率差别，几乎是由该技术原理决定的，具体是什么情况，以后在技术性文章里阐述。

4、SLAM需要吗？

这个问题回答起来也不简单，很多设计里，数字图像是在真实物理空间固定位置的，就和真实世界里的东西一样，这样的设计对SLAM（同步定位和环境重建）稳定性要求很高，往往需要多类传感器协作完成。

有的重点只需要做一些头部运动跟踪（比如游戏等），对虚拟物体和现实空间的融合要求不高。还有一些设计干脆就不做SLAM，任何显示就是在你视野正前方，比如一些信息提醒工具类的应用。

SLAM定义主要考虑当前器件的体积大小和计算功耗。总之一切回归场景。

5、一体还是分体？

简单回答，大家都希望在足够轻便，佩戴舒服，续航力又强劲的情况下，做一体机，无需连接外部设备。很可惜，当前技术很难做到。

大部分产品会在第一时间，根据场景决定一体式还是分体式。总体来说依照佩戴舒适度定义是最基本的方法，不过也不完全是，比如分体方式往往需要连线，违反一些安全环境要求，同时也多一些操作步骤。

有的场景则可以牺牲一定的舒适度来保证一体独立计算力，尤其一些专业场景会倾向于一体式（比如美军最近采购Hololens就是牺牲舒适度的），长时间佩戴场景则往往会用分体设计。

Rokid的两款产品是针对不同的场景设计，对于快速行动，即拿即用的场景，我们提供一体式（如Rokid Glass），而对于很多消费者场景，我们也会采用分体设计，保证佩戴舒适度（如Project Aurora）。

通过上面描述，大家可以感受到，抛开场景谈技术好坏是没有意义的，产品设计是一个极其复杂而细致的工作，远远不是一个创意，一个技术就可以完成的事情，需要每天进行很多思考。

AR产品是非常新的事物，即使我们团队潜心研究多年依然有很多问题有待解答，Rokid Lab的科学家和设计师们不断探索研究，不仅仅是基础技术上的突破（材料、光学、结构、电子等），更多的是用户场景和使用体验的研究，而这些都是AR产品走向千家万户的关键。

扫描二维码安装智能头条手机APP

0技术含量入门 一文读懂AR眼镜

扫描二维码安装智能头条手机APP

0技术含量入门一文读懂AR眼镜