今天小编分享的科技经验:Apple Vision Pro的一些启发,欢迎阅读。
图片来源 @视觉中国
文 | AR 研究媛
市面上对于 Apple Vision Pro 的解读有很多,但少有涉及 AR/VR 产品根本性问题的了解和洞察。
关于 Vision Pro 理想应用是 " 空间显示 "?Elon Musk 评价 AVP," 我不明白为什么要将电视机挂在鼻子上 ",其实这句评论没有贬低 AR/VR,甚至还高估了。因为使用 VR 作为沉浸式大屏(3D)显示其实是个伪命题。过去 25 年里,AR/VR 头显早有人尝试,并不是什么新鲜玩意,到如今显示技术得到长足发展,采用的螢幕规格越来越高。为什么你看不到飞机上 VR 观影的人 ?
这是直击灵魂的拷问。
Vision Pro 能否成为 " 空间显示器 ",关键不在你采用了哪种先进面板,不在显示质量、分辨率,也不在刷新率,而是一个人体工学的问题,在于人类视觉的底层机制变成了阻碍。Vision Pro 的 R1 再怎么强大,video 数据流处理过程再怎么先进,画面延迟再低,用 VST 就无法解决运动状态下凝视画面,耳蜗 - 前庭 - 眼球协调的问题。只要看到的画面运动刷新和内耳检测到的旋转速度不一致,晕动症或多或少就会发生,并且因人而异,这就意味沉浸式 VR 头显佩戴久了一定会有一部分人不舒适。依靠摄像头的 VST 无法高频日常使用,证据就是你很少看到坐飞机使用头显。
解决方案似乎只有发展真正的光学透视,天然的 OST 过程,光子打到视网膜转化为视觉神经信号传输到大腦,才能真正消灭延迟。
还有众所周知的视觉辐辏冲突,人眼观察不同远近(不同焦点)、不同位置的物体,晶状体收缩扩张和眼球转动会同时 " 协作 "。如果晶状体一直保持大小不变,固定一个焦点,长时间眼睛太难受了。VR 最困难的变焦显示,难倒了 Magic Leap,经过多年开发还是放弃了自己独有的 FSD(Fiber Scaning Dislay ) 方案,也让 Meta 的硬體科学家们困在原地。按照之前国外对 Vision Pro 光学透镜 Pancake 模组的分析,理论上是可以做到调焦显示的,但是苹果没有提,这说明技术不是一般的困难。然而,看久了固定焦点的虚像,眼睛会非常累,又是一个无法高频日常使用的核心难题。
关于重量。Vision Pro 的重量明显 " 超了 ",无法长时间佩戴。苹果的说法是已经使用了最好最轻的材料,无法再减重。很多人缺乏对 Apple Vision Pro 真正深入理解,苹果为了解决佩戴以往 VR 头显的周围视觉 " 交流 "、动态环境安全性的问题、让 VR 能真正 " 出街 ",开发了 EyeSight 方案,并且在硬體上做出了重大妥协,特别是重量上。
为了 EyeSight,苹果设计 OLED 曲面外屏,使用了 3D 裸眼技术,并且覆盖一层曲面玻璃,EyeSight 可以说体现了苹果对 VR 头显产品有异常深刻的洞察。但这些增重是否完全有必要,EyeSight 硬體实现方案,能否继续改进?其实 Meta 很早也展开过相关 " 视觉交流 " 的方案探索,只是没有真正落地。
图为 Meta "reverse passthrough system" 的一张 Demo 图
还有,因为这块正面外屏的存在,需要重新调整摄像头、深度相机、dToF 雷达的位置,相应的畸变矫正算法、数据融合、调整 VST 画面实时显示,算力、算法的要求更高更难了。
关于 VR 超大画幅和沉浸感,对于办公看文档、看电影,其实 VR 的优势并不明显。为什么,跟你去电影院不愿意坐前排是一个道理,视觉信息超过一定视角,人类的通常习惯是转头再凝视而不是转动眼球再凝视,所以理论上 Vision Pro 又一个应用场景是伪命题。
你眼前看到的真实世界其实是 " 拼凑 " 起来的,类似量子力学的非连续点粒子构成了世间万物,你看到的世界也是非连续的视觉信息。人眼视场角内最清晰的区網域(视网膜中央凹)仅占 2 °,眼球通过扫视、跳动等微动作捕捉视觉信息,然后大腦快速将其 " 整合 " 在一起。
" 佐治亚理工学院教授 Thad Starner 曾指出,受制于眼球运动的机械限制,显示屏的水平 FOV 不应超过 55 °,其中有效的眼动范围只有 45 °,而舒适的观看区網域可能不超过 10 ° 到 20 ° 左右。
由于看电影是一个长时间凝视 / 无需转头的过程,在 VR 中看电影实际上不像 VR 游戏那样需要那么大的 FOV。现实情况是,人眼盯着 40 ° 到 50 ° 高分辨率画面时,只用几分钟就会感觉视觉疲劳。因此,电影画面最好保持在 20 ° 水平,当画面超过 30 ° 时,用户可能会需要转头看,而不会转动眼球,这情况在电影院前排、或者大尺寸显示器上存在。"
换句话说,人眼主要注意螢幕中心 30 ° 范围的画面,在不转头的情况下,大 FOV 不仅没有带来沉浸优势,还带来了困扰。比如 BirdBath 这种主打 " 投屏显示 " 眼镜,发烧友使用它看文档、网页,需要转动眼球凝视虚像边缘的字体、画面像素信息的时候,体验就相当糟糕。
大 FOV 带来的沉浸感有不易察觉的代价。办公和看片,Vision Pro 的沉浸大屏并不会让你长期觉得舒适,而这恰恰是苹果重点宣传的一个使用场景。
关于价格,个人非常赞同国外 AR 资深专家 Karl Guttag 的说法,Vision Pro 价格贵不是重点,重点是 " 真的有用 "。
" 对于评论 AVP(Apple Vision Pro)价格的人,他们是从看待一项成熟技术而不是一项全新技术的视角出发。仅举一例,内存为 4KB 的 Apple II 初始零售价为 1298 美元(相当于 2022 年的 6268 美元),而最大内存为 48KB 的型号则为 2638 美元(相当于 2022 年的 12739 美元)。再比如,1979 年我买了第一台录像机,价格约为 1 千美元,按通货膨胀率调整后相当于现在的 4400 多美元,一盘 1.5 小时的空白磁带约为 10 美元(相当于 2023 年的 44 美元)。问题不在于价格,而在于 AVP 是否会成为人们经常使用的设备。"
Oculus 创始人 Palmer Luckey 的评价也非常有启发,
" 在产品策略上,苹果瞄准了正确的市场。相比于追求低价,硬體质量、舒适度、人体工学、分辨率、高质量内容才是前期更重要的目标,而降价是后面才要考虑的。 每家公司擅长、适合开发的产品不同,如果苹果追求入门级市场,可能会是一个错误。苹果努力打造分辨率最高、人体工学最好的头显,面向的是早期采用者,而这也是适合当下的策略。实际上,现在这个阶段价格高低并不是关键,尤其是对于早期采用者并不重要,虽然 Vision Pro 售价高达 3500 美元,但即使卖到 5000 美元,也有人会买。 通过 Vision Pro,苹果可以让 XR 头显在市场上获得更多关注,并刺激早期采用这之外的更多人的需求,然后再降价至人们买得起的水平。"
还有更多,比如扎克伯格还对竞争对手苹果 AR 发表了看法。他认为,
这段时间 Vision Pro 很热闹,但 AVP 的启发不仅仅是产品层面上,也少有人注意到下面这些事实和疑问:
苹果只不过发布了一个司空见惯的 VST 头显,Vision Pro 的许多特点和关键创新,像竞品 Meta 也提出过、实践过,Vision Pro 并没有解决 VST 头显的许多重要问题:比如多焦点显示、重量、发热、续航、VST 在暗光环境或过曝光线时画面对比度、全身追踪,并且价格过于昂贵。但 Vision Pro 就是成功引爆市场,全球媒体热议,这可能才是同行需要反思的地方。
先行者做不到的,Vision Pro 也一样,为什么换成苹果头显大家就能接受?而且即使定价如此之贵。很多人评价 Vision Pro 就是 " 配置很高 ",传感器数量上大幅超越友商,让眼球追踪的准确性可靠性明显提升,还带来了超大范围的手势识别;视觉 / 深度相机 / 激光雷达 SLAM 融合,人机互動和 VST 的画面(畸变)矫正无比丝滑和自然;还有桌面级性能的核心处理器 M2,从硬體底层设计传感器数据处理芯片 R1(专用集成电路芯片 ASIC,类似 iPhone 协处理器?),定制的多片式拥有非标曲面的 Pancake 模组,4K 硅基 OLED 内屏,OLED 前向(外屏)eyesight 裸眼 3D.... 等等。所以,问题是硬體堆料能否复制另一个 Vision Pro,究竟是品牌起作用还是产品本身?
Apple Vision Pro 发布会上并没有遵循行业 " 常规 ",公布具体的像 PPD、FOV、Pancake 模组光学性能,并且要求 Apple Store 员工等不能提到 VR 等字眼。空间计算其实早就有人提出过类似概念,从苹果口中出来效果却完全不同,苹果不仅培训销售人员避讳使用和提及 "VR" 等字眼,并且发布会用两段定义了 Vision Pro, "most advanced personal electronics device ever" + "a standalone spatial computer portable enough to use anywhere"。即最先进的个人消费电子设备,任意场景都适用的空间计算机。
库克相信,未来我们谁也离不开属于个人消费电子的 " 空间计算机 "。这是从 iPhone 的逻辑延伸。
Oculs 创始人 Luckey 提到了一个 " 社会工程 "(social engineering)的概念,本意指的是通过大规模影响人们的态度和社会行为,让目标人群产生所需的特性本质上来讲,苹果不是通过工程设计来让人接受 XR,而是通过社会工程,改变社会对 XR 的预期。换句话说,Vision Pro 通过恰当的营销、名人带货,也可以改变人们对 XR 的固有印象,让头显技术比之前看起来更酷,即使 Vision Pro 并没有轻薄的外观。
沃尔特 · 李普曼在他的 1922 年的《公众舆论》(Public Opinion)一书中提出,人与环境之间的真实环境太大、太复杂,而且瞬息万变,无法直接认识。每个人都会建构自己的伪环境(pseudo-environment),这种伪环境是主观、有偏见且必定更精简的世界的心理形象,而在某种程度上,每个人的伪环境都是虚构的。人们 " 生活在同一个世界中,但在不同的世界中思考和感受 "。李普曼说的 " 环境 " 可称为是 " 现实 ",而 " 伪环境 " 更像是今天所谓的 " 建构现实 "。人们 " 在被社会和文化世界创造的同时,也创造自己的社会和文化世界 "。
社会建构主义(英语:social constructionism)是社会学和传播学中的认识论。大多数社会建构主义者都信奉 " 语言不是反映现实,而是构成(创造)了现实,即 " 没有事实,只有诠释。"
事实是:Apple Vision Pro 是一款领先同行的产品,但整体来说,它并没能领先时代。
许多人相信历史是天才和英雄人物决定的,大众只是一群被赶着到处跟着跑的鸭子。中心化比去中心化好,让行业分工明细、开放的自组织演化不如由封闭的精英小圈子制定 " 标准 " 并进行 " 质量管控 ",起码 iPhone 和 iOS 已经是肉眼可见的前例。
苹果对于用户的深度理解、对于产品创新的洞察,对于未来的想象力,组合起来就是一种魔力,也是扭曲现实力场的来源。投资者、行业巨头和创新企业、用户都在观望,姗姗来迟了很多年的 Apple Vision Pro 能够引导 VR/AR 真正走出极客小众,成为大众普及的消费电子产品。很多巨头等着别人试错成功后在后面摘果子。
深入研究 Apple Vision Pro,可以明显地感知到:这家公司擅长从底层向上完全构建,自成一体,而非等着光学器件、显示屏、新式传感器、算法和算力芯片、应用开发慢悠悠 " 协同 " 发展,不同实力的厂商分散地制造一堆不同品相的垃圾。
就像苹果投入巨大、一直疯传汽车 " 泰坦 " 被取消,Apple Vision Pro 的产品态度,把用户体验放在最高优先级,从不制造垃圾的信念,不发布不成熟的低用户价值的 " 新产品 ",还有这家公司的营销手法,可能才是最最值得学习的。