Meta不计成本作出了Orion这一接近消费级AR眼镜之后,彭博社爆料苹果启动Atla“智能眼镜”项目,OpenAI招募了前Meta公司Orion增强现实眼镜项目的前负责人Caitlin Kalinowski,也在酝酿在AI硬件的动作。
因为LLM的突破,这一波狼来了,对于AR眼镜来说,可能从根本上已经不同以往。在谈这一波AI+AR眼镜热潮前,有一家在国内甚少被讨论的AR眼镜公司,INMO,它的“失败”案例值得被研究。
曾经有一个「AR四小龙」概念 ,将INMO 排第四。
国内消费级AR创业圈子,INMO名气不大,却有一股子莽劲。这家公司在基础技术远未成熟的情况下,十分“严肃”地做出了一台设计正统、功能完整的消费级AR眼镜,而且上市发售了。
亚洲四小龙、AI 四小龙、再到AR四小龙,是形容它们活力满满,它日必成龙成凤。 2022年开始,国内AR创业圈子里诞生了一个由XREAL、雷鸟创新、Rokid、INMO影目组成的「AR四小龙」行业概念,它们代表着中国消费级AR的希望之星。 但排行老四的 INMO 不似小龙,更像是中世纪的古典骑士,那种正经、严肃、笨拙、悲情的堂吉柯德式骑士。
INMO 存在感相当弱,特别是与其他“三小龙”对比。XREAL号称全球消费级AR市场份额领先,关键的BirdBath光学模组、微机电、整机ID确实强一些,多个早期BirdBath方案眼镜在国外被大量引用讨论;雷鸟创新脱胎于TCL创新实验室,在近眼显示光学设计上积累know-how,还敢在光引擎上尝试RGB全彩的Micro LED方案;Rokid累计融资金额最多,B端C端双拳出击,创始人祝铭明的创业团队阵容豪华,有教育、数字文化、娱乐、旅游、地方机构的“朋友圈生态”,而且硬件供应链资源属于独一档。相比之下,INMO影目科技,似乎找不到一些足够差异化足够印象深刻的特征,能精准描述。
如果要给 INMO贴个标签,产品路线特立独行,「顽固又硬核」。
相比Hololens和Magic Leap 这种「AR头盔」,集成了大量传感器、电池、专属算力芯片的工业级AR眼镜,INMO AIr2 更接近真正的消费级AR眼镜,无论它一眼看上去的体积,产品原理还是实际功能,完整又「极简」。
INMO Air 2不同于XREAL、雷鸟、Rokid 三家Air系列消费级AR眼镜,在空间中虚拟一块固定尺寸的「大屏幕」主打观影和游戏,强调空间显示功能,INMO Air 2有号称最为轻量级的SLAM,有基本的虚实交互,透光率更高。
也不同于OPPO Air、李未可眼镜以信息提示、翻译场景为主,产品多用单绿色Micro LED配合衍射光波导,INMO Air 2 在光波导方案上,实现了全彩色显示而非仅仅显示绿色。而类似OPPO、李未可的信息提示光波导AR眼镜,在使用场景、刚需程度、使用频率、出货量上,可能还比不上雷鸟、XREAL、Rokid三家BirdBath原理的观影眼镜。
INMO特立独行在于,它在基础技术还未成熟的情况下,硬要做出一套有基础AR功能、针对消费级可正常穿戴的日常眼镜,一体式而非分体式,计算、传感、电池、显示都高度集成在眼镜本体,形态接近下一代消费电子。2022年10月底发布,2023年4月才正式上市的INMO Air 2,采用了截然不同,或者说极为罕见、独一无二的硅基OLED+阵列光波导产品方案。
AR眼镜的产品原理,说起来很简单:
首先,将微显示屏的光学图像,以微型投影仪的方式发射出去。实现组件就是所谓的光引擎或者眼镜的“光机”
其次,让图像显示的数字内容跟现实的光线“混合”在一起,以某种设计好的方式传输进入眼睛。这涉及的过程就是光传输,实现组件就是光学模组,比如BirdBath透镜组合、自由曲面透镜、衍射或者阵列光波导。
微显示屏是第一道巨坑,而且是绕不开的成本大头。目前三种的主流微显示屏,硅基液晶(LCoS)、硅基OLED(Micro OLED)、Micro LED,它们都是硅基板而非玻璃基板,在很小的显示面积上实现极高的像素密度,类似芯片的方式“种植”微显示器,制造过程同时涉及半导体和先进显示。
硅基液晶目前在分辨率、全彩显示方面性能优异。但问题在于,它并不属于自发光的直接显示,发光器件经过液晶层的相位变化光线调制和极化,会有层内的各种反射、散射损失。
如今的LCoS光引擎先以R、G、B三色panel 以半透半反分光,再以PBS棱镜的方式“聚合”在一起,光引擎结构复杂体积难以大幅压缩,而且出射图像亮度不够,经过传输后入眼亮度低,这是AR眼镜最关键和最致命的问题。
硅基OLED作为目前的主流方案,OLED自发光组件,结构简单、体积小、色彩表现良好。但问题是采用先进制程压缩单像素面积、进一步提升分辨率的时候,良率低,成本高,高分辨率面板价格非常昂贵。
微显示屏作为新兴显示产业,终端品牌都需要从供应链厂商采购,Apple Vision Pro使用了2块索尼4K分辨率的硅基OLED微显示屏作为内屏。之前媒体流传的BOM清单显示,售价3499美元的Apple Vision Pro硬件物料成本约 1509 美元,其中索尼供应的两片4K分辨率OLED内屏一片350美元,合计 700 美元,几乎占据了物料成本的一半,为成本最高的零组件。相比之下,台积电代工的M2 处理器仅需 120 美元。
天价Apple Vision Pro如今销量惨淡到被传停产,索尼的4K分辨率微显示屏可谓“功不可没”。
硅基OLED的另一个致命问题,是亮度依然不够高,覆盖不了白天日光环境,特别是跟只有1%光效率衍射波导组合在一起使用的时候。
Micro LED是最终极最理想的微显示屏,无机材料寿命长,也是自发光原理,超高亮度远超硅基液晶和硅基OLED,色彩饱和度和对比度也是最佳。但受限于基础技术的问题,没有办法在单片微显示屏面板上实现RGB三色像素集成,换句话说,它连彩色显示都很难做到,只能采取工程化的办法,而且高分辨率微显示面板生产制造非常难,同样巨贵无比。
Micro LED要实现彩色显示,要么通过三块R、G、B小面板「合光」,三个控制板加合光棱镜,即JBD的x-cube棱镜方案,要么是还在实验室里的堆叠像素方案。
Micro LED目前的R、G、B三种面板的无机发光材料底层物理过程迥异,亮度一致性差异很大,而要将Micro LED分辨率提升到2K、4K,面临一系列基础物理、大规模生产制造良品率问题,理想的高分辨率Micro LED,成本也是天价。
一句话总结,硅基液晶亮度不够且光引擎组件很难小型化;硅基OLED亮度勉强,分辨率高但是成本也高;Micro LED最理想但不成熟,连彩色显示都困难,只有单绿色光引擎可以达标。
说了这么多,这还是微显示屏的第一个坑。第二个坑,光传输组件,同样困难无比。
AR眼镜能够正常看清外界,要求它能像普通的眼镜一样高透光,与此同时,光引擎出射的数字内容和外界的真实光线,也需要“混合”一起进入眼睛。
BirdBath和自由曲面方案是一组透镜组合,将眼镜顶部光引擎发出的图像光线,经过反射、折射、对焦等设计好的光路,传导到眼睛,这个方案不可避免在眼睛前方设计一个透光率不高的半透射半反射镜片。BirdBath和自由曲面眼镜,像XREAL、雷鸟、Rokid的Air系列眼镜,目前只有20%左右的透光率,只能是「墨镜」,最佳使用场景是观影。
而像Apple Vision Pro这样的VR眼镜,干脆直接把“屏幕”放在眼前,设计一个非常复杂的折反射光学镜片组合,把图像光传输到眼睛。VR挡住所有前方的自然光线,依靠摄像头才能看清外界,这就是常说的依靠摄像头“透视”的VST方案。
摄像头传输画面的延迟、画面刷新率、图像畸变导致的眩晕,以及难以规避的VAC视觉辐辏冲突,你只能盯着一定焦距的画面,眼睛会快速疲劳,还有沉重的头盔设计,种种难以改进的佩戴体验。VR已经被市场反复验证了十几年,几乎注定了不会成为C端消费电子的主流,VST原理的眼镜即使是苹果,10年磨一剑的Vision Pro,也避免不了成为吃灰的摆设。
AR眼镜像普通眼镜一样能做到光学透视OST,无限景深,还有一个方案,就是光波导。
波导技术并不是什么新发明,我们熟悉的光通信系统中,用来传输信号的光纤组成了无数条连接大洋彼岸的海底光缆,就是波导的一种,只不过传输的是我们看不见的红外波段的光。在AR眼镜中,要想光在传输的过程中无损失无泄漏,“全反射”是关键,即光在波导中像只游蛇一样通过来回反射前进而并不会透射出来。
光波导总体上可以分为几何光波导(Geometric Waveguide)和衍射光波导(Diffractive Waveguide)两种,几何光波导就是所谓的阵列光波导,也就是文章最开始INMO Air 2使用的那种。
阵列光波导里,耦合的图像光进入波导的一般是一个反射面或者棱镜。 在多轮全反射后光到达眼镜前方时,会遇到一个“半透半反”镜面阵列,耦合图像光再耦出波导,进入眼睛。(图a所示)
“几何光波导”的概念最先由以色列公司Lumus提出并一直致力于优化迭代,至今差不多快二十年了。它的制造良率问题一直没有根本性的进展。
阵列光波导的问题就出在多个“半透半反”(确切说是“部分透部分反”)的镜面。它们是嵌入到玻璃基底里面并且与传输光线形成一个特定角度的表面,每一个镜面会将部分光线反射出波导进入人眼,剩下的光线透射过去继续在波导中前进。
阵列光波导,图像质量包括颜色和对比度可以达到很高的水准,而且光传输效率最高可以达到10%左右,比衍射光波导只有1%光效率,优势明显。 但问题在于,阵列光波导工艺流程比较繁冗,特别是“半透半反”镜面阵列的镀膜工艺。
由于光在经过多个半透半反镜面阵列传播过程中会越来越少,阵列中五六个镜面的每一个都需要不同的反射透射比(R/T),以保证整个动眼框范围内的出光量是均匀的。 并且由于几何波导传播的光通常是偏振光,导致每个镜面的镀膜层数可能达到十几甚至几十层。
另外,这些镜面是镀膜后层层摞在一起并用特殊的胶水粘合,然后按照一个角度切割出波导的形状,这个过程中镜面之间的平行度和切割的角度都会影响到成像质量。因此,即使每一步工艺都可以达到高良率,这几十步结合起来的总良率却是一个挑战。每一步工艺的失败都可能导致成像出现瑕疵,常见的有背景黑色条纹、出光亮度不均匀、鬼影等。
因为阵列光波导难以解决的生产良率问题,以及多个半透半反镜面外观上影响美观的条纹,另一个方向的衍射光波导成为了包括Hololens、Magic Leap 实际应用的主流。而衍射光波导同样也有一堆问题,不同波长可见光衍射角度不一致,彩虹纹、光传输效率低、眼镜前向漏光影响正常的“视觉交流”。
除了光引擎和光传输组件的种种技术困难,难有完美的解决方案,更大的FoV(虚拟图像显示视野),更大的EyeBox(适应绝大多数人的双眼瞳距),更高的入眼亮度,对于AR眼镜实际体验也至关重要。行业里,一直围绕着不同微显示屏光引擎设计、光波导基底材料、衍射和阵列光波导在持续改进和努力突破。
总结来说,性能全面没有短板的微显示屏,OST光学透视原理的高质量图像传输,完整的虚实结合和先进人机交互。这是一体式消费级AR眼镜的的不可能三角。
回过头来,这也是INMO Air 2的奇葩之处:INMO Air2搭载的珑璟LCE2210V 模组,在光机方面采用Mirco-OLED屏幕,光传输采用阵列光波导全彩双目方案。亮度勉强、分辨率一般但全彩显示效果优秀的硅基OLED屏幕,制造困难但光传输效率更高的阵列光波导,这样的方案,几乎是独此一家。INMO执着于做成一副轻量化+彩色显示+高透光的光波导眼镜。
从2012年Google Glass 正式推出开始,满打满算已超过第十二个年头。消费级AR眼镜有潜力取代智能手机,成为下一代消费电子的「主力」,基本上还停留在痴人说梦的阶段。
虽然AR眼镜这十多年来一系列新技术层出不穷。
从深层次创新的角度来说,国外像Hololens引入了v-SLAM、衍射光波导、窄光谱的激光显示;Magic Leap演示了更加轻量化的AR一体机,紧凑强大的LCoS光引擎,大FoV、高分辨率、显示效果出色且能全局和分区调光;国内,Xreal带来了BirdBath光学透镜组合,在硬件成本和显示效果之间达到了较好的平衡,雷鸟尝试更终极的全彩显示MicroLED和光波导组合方案,Rokid则在BirdBath模组上实现了难度较高的SLAM锚定和交互,眼镜与主机和外设一起,意图实现移动办公和移动娱乐。
还有最近的重磅,Meta Orion眼镜将轻量化、高性能、更好的OST光学显示方案和先进人机交互统统满足,但是以不计成本的方式。
Meta Orion极为罕见地将碳化硅晶圆取代玻璃做衍射光波导基底,碳化硅超过2.0的材料折射率将FOV虚像视野提升到70度,可谓前所未有。Meta Orion在一副100克左右的眼镜上集成了来自JBD合色方案的Micro LED全彩显示的光引擎、复杂的多片衍射波导、电池、无线高速数据传输、高精度的眼球追踪、视觉SLAM等完备且先进的AR人机交互手段,还有融合了Meta强大的端侧小模型。
相比INMO Air 2,Meta Orion也是一款能做到彩色显示的光波导AR眼镜。它满足日常佩戴使用的轻量化设计,高透光、彩色显示,上手体验极佳的AR人机交互,相比INMO Air 2有极大提升,也是AI眼镜目前最好的标杆。但没法大规模量产,成本是惊人的10000美金。
在基础技术极为原始和粗糙的阶段,在产品可靠性、易用性、大规模生产成本和良率都十分有限的情况下,如何找到PMF,是消费级AR眼镜、通用人形机器人这些下一个10年最具想象力的产品,所普遍面临的困境。
螺丝壳里造一个道场,角落里的技术高潮解决不了创业公司长期生存问题。当新技术出现,与原有产品产生「核子反应」,内爆出一个一定体量的市场,衍生出能够被验证的使用场景,这样的机遇非常罕见。
如今,这样的机会恰好出现在AR眼镜上。因为LLM的爆发,生成式AI、多模态端侧模型,AI+AR的结合,是大模型被一致看好的“落地”方式。但是AI眼镜的硬件进展,在大规模高良率生产、成本可控、体验完整且优秀方面,路依然很长,很难。
本文来自微信公众号“X研究媛”,36氪经授权发布。