文/VR陀螺 冉启行
2025 年,AI 眼镜市场正式迈入「百镜大战」第二年。在 Ray-Ban Meta 系列凭借时尚外观与一系列实用功能引爆全球市场,小米、百度、阿里、传音、字节等科技巨头加速入局的背景下,AI 眼镜的形态之争也愈发激烈。
目前,各家眼镜产品从基础音频交互、音频+摄像交互到AR眼镜,产品形态分化显著,技术路径与市场定位各有差异,虽谈不上百家争鸣,但已呈现出多元发展的强劲态势。这是新兴产业发展初期阶段所表现出来的典型特征,这是一个试错与创新的活跃期,只为探索更适合「科技与人文的十字路口」。
据陀螺研究院数据显示,预计 2025 年全球 AI 眼镜出货量或将超过 500 万台,市场规模超百亿。如此市场环境下,本文将围绕 AI 眼镜的三大主流形态展开深入分析,探讨技术演进、市场逻辑与未来终局。
图源:陀螺研究院
AI音频眼镜:极简主义的产品逻辑
智能音频眼镜可以说是 AI 眼镜的开山产品,它率先将眼镜这类传统消费产品「电子化」。该类眼镜产品主打轻量化设计,主要通过蓝牙主控芯片(MCU)+麦克风+扬声器+电池的组合,再以连接智能手机为前提,实现诸如通知播报、关键字唤醒、听音乐、电话接听等基础功能。
在手机端接入 AI 大模型后,智能音频眼镜得以扩展更多自然语言交互的场景,以形成真正的 AI 音频眼镜。目前,AI 音频眼镜的核心技术差异主要在于音频元器件的选择与算法优化,以及手机操作系统的融合深度。它们会直接决定用户“听”与“说”的基础体验,以及与手机连接之后所产生的一系列交互应用。
有限的电子元器件与应用场景,造就了这一独特的眼镜品类。相比其他 AI 眼镜形态,AI 音频眼镜优势也十分明显:于厂商而言,供应链技术成熟度高,镜框设计可塑性强。这意味着厂商可以在较短时间周期快速生产、迭代产品,并且电子元器件主要内置于镜腿,这让产品在镜框上有了更多的选择,厂商可设计出更多 ID。
于用户而言,AI 音频眼镜的主要优势在于续航时间较长、佩戴舒适性好(相比普通眼镜重量增加10-20g)、价格也相对更亲民,镜框款式选择多样。如果只是想要一个可以随时接听电话,轻量级 AI 交互需求的眼镜,那么 AI 音频眼镜无疑是理想的性价比之选。
米家音频眼镜2
目前,市面上比较有代表性的AI音频眼镜产品包括华为智能眼镜 2 系列,米家音频眼镜系列(蜂巢科技)、GetD 能眼镜、李未可 Metalens Chat 智能眼镜等。
极简主义是 AI 音频眼镜的产品优势,不过,也是制约其拓展更多应用场景的围城。虽然华为等厂商通过生态联动、深度系统绑定来弥补这一短板,试图增强产品的竞争力,但从长远角度来看,AI音频眼镜很可能沦为“过渡性产品”,这是技术发展的必然趋势,以及现有市场的选择。
AI音频+拍摄眼镜:消费级爆款的代表形态
在 Ray-Ban Meta 系列销量超 200 万台的示范效应下,AI 音频+拍摄眼镜迅速崛起,成为当前市场主流,各大厂商追逐的标准产品形态。
相对 AI 音频眼镜,AI 音频+拍摄眼镜拓宽了信息采集维度,进一步丰富了人机交互方式。通过摄像元器件,一方面,用户可以完成第一视角摄像、摄像,甚至直播,记录生活,增强社交属性;另一方面,摄像头在与多模态 AI 大模型融合之后,可以实现视觉问答、物体识别、AI 绘画等丰富功能,全面提高生活、工作效率,进一步增强 AI 眼镜的应用场景。
摄像头模组通常放置于 “镜框” 边缘,这使得镜框内存在相应的走线。走线的存在对镜框设计形成限制,导致大多数厂商只能在颜色方面做文章,不像 AI 音频眼镜那样,在镜框设计上能为消费者提供丰富多样的风格选择。当然,一个例外是,如果一个单品眼镜达到预期量级时,为满足更多用户的多元化需求,厂商自然不会吝啬重新开模,再来几款设计。
此外,摄像头模组、ISP 等芯片元器件的增加,也加剧了眼镜的续航,增加了产品的重量。相对于 AI 音频眼镜普遍 30-40g 的重量(不含近视镜片),AI 音频+拍摄眼镜通常会再加 10g 左右,重量来到至少 40-50g;续航方面,目前,已上市的 AI 音频+拍摄眼镜连续音频续航时间为 3-4 小时,连续拍摄影像的续航时间为 0.5h-1H。鉴于此,不管是 Meta、雷鸟创新,还是闪极,都给出了一套持续「续航」的方案,如可多次充电的眼镜舱,又或者是电池颈环。
AI 音频+拍摄眼镜无疑是比普通 AI 音频眼镜场景更丰富的产品,不过,于厂商而言,AI 音频+拍照眼镜的技术难度也跟着上了一个台阶。一款眼镜,不仅需要主控芯片、扬声器、麦克风电池,由于摄像头的加入,ISP 图像处理芯片也成为了关键一环,它是成像的关键,质量直接关乎用户的体验与分享意愿。此外,单个摄像头模组还会涉及镜头、 CMOS 图像传感器等选择。
所以,为保证成像效果,以及 AI 交互效率,Meta 在第二代 AI 音频+拍摄眼镜上(Ray-Ban Meta)直接选择了集成 CPU、GPU、ISP、NPU、Engine for Visual Analytics、内存等诸多模块的骁龙 AR1 平台。虽然这款芯片一开始定位用于带显示的 AR 眼镜,Meta 似乎有一点「大材小用」,但只要市场反馈足够好,倒也无所谓。
不过,对于不少初创公司厂商而言,骁龙AR 1也并非最好的选择,毕竟 4nm 工艺芯片的 BOM +高通的 License 费用可不是一笔小数目。所以,直接采用蓝牙 MCU+ISP芯片的解决方案,也是一个相对不错的「平替」。此外,也有大厂还想继续打磨骁龙AR1,在其基础上再增加一个蓝牙主控芯片,形成双芯片+双系统的解决方案,以降低眼镜在待机时的功耗。
所以,行业内现在已经延伸出了多种 AI 拍摄眼镜的芯片解决方案。除市面上已商用落地的单 SoC 解决方案:骁龙AR1、展锐 W517 外,还有诸如:恒玄2800+研极微ISP、恒玄2800+星宸ISP、高通 AR1+恒玄 2800、MTK+恒玄 2700、物奇微 WQ7036+STM32N6 等不同芯片组合的解决方案。
一个标准的产品形态背后,可谓有数十种技术形态的组合。对于消费者而言,表面上大家看到的都是形态相似的一款款眼镜,但这背后的技术与供应链选择可谓相当繁琐,最终得到的产品体验也千差万别。「抄一款 Ray-Ban Meta 出来」,也绝对没想象中那么容易。(推荐阅读:《AI眼镜 | 供应链易入,高分产品难求》)
AI+AR眼镜:终极形态进行时
AI 眼镜的终极产品形态,无疑是 AR 眼镜,这也是 Meta 设计智能眼镜的初衷。
目前市场已形成两类主要 AR 眼镜产品形态,一类是不带摄像头的 AI 音频+AR 眼镜产品,如星纪魅族 StarV Air2、影目 Go2、Even G1(不含扬声器)等;另一类是完全体的 AI 音频+拍摄+AR 眼镜,如 Rokid Glasses、雷鸟X3 Pro、TECNO AI Glasses Pro、Meta Orion、Spectacles 24、INMO Air 3 等。
(一)「信息提示」眼镜再进一步
第一类产品技术成熟度方面具有显著优势,特别是单绿色 Micro-LED+衍射光波导的方案,产业已经探索沉淀多年,AI 大模型的加持,可进一步提高这一类 AR 眼镜产品的应用场景。
过往,这一类产品被统一归类为主打「信息提示」的眼镜产品,应用场景相对单一,但在 AI 大模型的加持下,它可以有更多的延展性。厂商可以设计诸多的 AI Agent 实现比以往 APP 形式更方便、快捷的应用场景。
星纪魅族 StarV Air2
诸如,在继承普通 AI 音频眼镜一系列语音交互的基础上,AI+AR 音频眼镜可以拓展出更精确的 AI 语音转文字功能,帮助听障人群,看见文字;AI 实时翻译,在跨国商务洽谈、国际学术交流场景中能实时打破语言壁垒;以及更准确的 AI 语音指令执行、AI 备忘录、AI 提词器等。
在芯片方面,该类轻量级 AR 眼镜通常采用可穿戴芯片,如 W4100,W5100、W517 等,因为它不仅仅需要蓝牙连接,还需要支撑一定的「显示」。W 系列芯片已广泛应用于智能手表,对于厂商而言,BOM 成本也更加可控。
(二)「顶级AI眼镜」的技术探索
相比之下,第二类 AR 眼镜产品从技术逻辑上来看更加复杂一些,它不仅要兼顾第一类产品的音频及 AR 显示技术,还要确保摄像头拍摄与 AI 技术的融合,这也是我们目前能看到 AI 眼镜的最顶级产品形态。
不管是 Meta Orion、Rokid Glasses,还是雷鸟X3 Pro 都展示了在增加摄像头之后,一系列复杂环境感知下,AI+AR 的巨大应用场景。摄像头赋予了这些 AR 眼镜实时捕捉外界图像信息的能力,结合 AI 技术,它们能够精准识别物体、场景以及人体动作等元素。
如 Meta 此前展示的个性化的 AI 助手,Meta Orion可以通过摄像头识别桌面上的所有物体,并给出一份完整的食谱建议和热量参考。由于佩戴式的眼镜设计,这让用户还可以空出双手,并获得 AR 实时显示的烹饪指导。
理想很丰满,现实很骨感。值得注意的是,在 AR 眼镜的技术逻辑里,光学、重量、续航本就是不可能三角,现在还增加一个摄像头,这让本就棘手的技术平衡难题再次雪上加霜。所以,目前已发布、亮相的这些 AR 眼镜的整体技术节奏都会更慢一些。AR 显示与摄像头的产品定义,也让高通骁龙 AR1 也几乎成了标配。
AR 光学技术方面,各家厂商在 Micro-LED 光引擎(单绿、全彩)、光波导材质(树脂、玻璃、碳化硅)、光波导工艺(纳米压印、刻蚀)的选择上都有所差异,目前暂未形成统一的技术趋势,「探索」是主旋律。
雷鸟X3 Pro
如 Rokid Glasses 由于采用了一拖二(1×Micro-LED+2×光波导)的光学方案,一定程度上降低了 BOM 成本,且单绿色 Micro-LED 微显示器较为成熟,在价格(2499元)与量产上具有一定优势;雷鸟X3 Pro 采用了全彩 Micro-LED+刻蚀工艺的光波导,标准的产业技术形态下,让其在 AR 显示上具有更加突出的色彩表现。
写在最后
从中短期、以及用户需求维度出发,AI 眼镜目前并非能用“单一形态统治市场”,而是场景分层与技术渐进的共存。
-
1000 元以下的 AI 音频眼镜具备极致的性价比,产品简约,虽不能做成「科技爆品」,但能成为「日用品」;
-
1000-2000 元价价位的 AI 音频+拍照眼镜形态凭借“够用且价格合适”的特性,仍将覆盖 50% 以上用户,满足大众市场的基本需求;
-
2000—5000 价位的 AR 眼镜由于集成了更为先进的 AR 光学和交互性能,可以拓展更多应用场景,对于部分极客用户与 To B 特定需求人群而言,留足了想象空间。
不过,从技术发展的趋势来看,双目全彩 AR 眼镜依旧是 AI 眼镜未来的迭代方向。类似于智能手机市场的发展逻辑,核心技术的不断突破与成本的有效控制,最终会构建起一道完整的的技术壁垒与生态空间,杀手级的应用场景也会促使消费者跟上时代的潮流。
在「百镜大战」的推动下,AR 产业的未来进程正在加速演进。