从苹果Vision Pro出发，聊聊3个值得关注的AR关键技术

2023/06/20 推荐： 林影落评论有奖阅读本文需 5 分钟

从苹果Vision Pro出发，聊聊3个值得关注的AR关键技术

用眼睛看，用手操作，是我们在物理世界里再自然不过的交互方式了。但要在 AR 世界里延续这种自然交互，却需要依托的三个关键技术点。

Apple Vision Pro 的发布没有让我们失望，在里面，我看到了这三个技术带给自然交互的力量。

更多Vision Pro的干货：

苹果Vision Pro上有哪些设计亮点？我总结了这10个（视觉篇）

随着上周苹果发布会带来久违的 One more thing 环节，苹果的 MR 头显产品终于发布了。

阅读文章 >

一、眼动追踪技术

我们在现实中如果需要与哪个物体有进一步的交互，都会自然地将视线集中在它的身上，当我们耗费注意力让视线聚焦在它身上的时候，就已经代表了我们的选择。

这个过程涵盖了目前界面领域上的两个状态：激活态（聚焦）和点击态（选择）。眼动追踪技术，实现的是看到聚焦这个过程。

这个技术当然并不是首创，AR 眼镜的先驱，Microsoft Holoens 第 2 代的交互就主打了 Eye-gaze，就是用眼睛来聚焦的功能。

而在之前，Microsoft Holoens 第 1 代的头动（Head-gaze）交互其实也已经有用眼睛来看和激活的概念了。但 Head-gaze 里使用头部微微移动来控制屏幕中心的一个点（Gaze）来激活内容，和我们本来的自然交互始终是有差距的，因为实际上我们聚焦一个物体，并不需要每次都靠头动，靠眼睛动就行了。

不过，虽然眼动追踪技术更解决自然交互的标准，但头动交互并不是没有可取之处，比如我团队目前自研的眼镜还只能支持 Head-gaze 交互。这种交互手段的成本和技术难度更低，比起用手/鼠标/遥控器等去聚焦激活的方式，它更加贴近我们用眼睛看这个自然交互理念。

另外，眼动追踪技术实现了激活态，却还没真正实现选择，也就是那个点击态。作用是告诉机器我确认是它了。

严格来说，对于不需要操作的东西，省去手这个确认操作是很有必要的，比如，我一边吃零食一边追剧的时候，就很希望不用每次操作前都要擦一擦我的脏手……在制造领域，类似这种解放双手的需求也经常被客户提出。

为了更自然的交互，也许这也可以成为我们畅想的一部分。之前我写过一个专利，就是靠脑电波技术来进行简单的确认。

专利申请指南：