深度报告

推广

最新资讯

2025「百镜大战」，三大产品形态之争

发布时间：2025-04-17 10:21 | 标签： AI眼镜百镜大战产品形态

转载来源：VR陀螺

微信扫一扫：分享

微信里点“发现”，扫一下
二维码便可将本文分享至朋友圈

文/VR陀螺冉启行

2025 年，AI 眼镜市场正式迈入「百镜大战」第二年。在 Ray-Ban Meta 系列凭借时尚外观与一系列实用功能引爆全球市场，小米、百度、阿里、传音、字节等科技巨头加速入局的背景下，AI 眼镜的形态之争也愈发激烈。

目前，各家眼镜产品从基础音频交互、音频+摄像交互到AR眼镜，产品形态分化显著，技术路径与市场定位各有差异，虽谈不上百家争鸣，但已呈现出多元发展的强劲态势。这是新兴产业发展初期阶段所表现出来的典型特征，这是一个试错与创新的活跃期，只为探索更适合「科技与人文的十字路口」。

据陀螺研究院数据显示，预计 2025 年全球 AI 眼镜出货量或将超过 500 万台，市场规模超百亿。如此市场环境下，本文将围绕 AI 眼镜的三大主流形态展开深入分析，探讨技术演进、市场逻辑与未来终局。

图源：陀螺研究院

AI音频眼镜：极简主义的产品逻辑

智能音频眼镜可以说是 AI 眼镜的开山产品，它率先将眼镜这类传统消费产品「电子化」。该类眼镜产品主打轻量化设计，主要通过蓝牙主控芯片（MCU）+麦克风+扬声器+电池的组合，再以连接智能手机为前提，实现诸如通知播报、关键字唤醒、听音乐、电话接听等基础功能。

在手机端接入 AI 大模型后，智能音频眼镜得以扩展更多自然语言交互的场景，以形成真正的 AI 音频眼镜。目前，AI 音频眼镜的核心技术差异主要在于音频元器件的选择与算法优化，以及手机操作系统的融合深度。它们会直接决定用户“听”与“说”的基础体验，以及与手机连接之后所产生的一系列交互应用。

有限的电子元器件与应用场景，造就了这一独特的眼镜品类。相比其他 AI 眼镜形态，AI 音频眼镜优势也十分明显：于厂商而言，供应链技术成熟度高，镜框设计可塑性强。这意味着厂商可以在较短时间周期快速生产、迭代产品，并且电子元器件主要内置于镜腿，这让产品在镜框上有了更多的选择，厂商可设计出更多 ID。

于用户而言，AI 音频眼镜的主要优势在于续航时间较长、佩戴舒适性好（相比普通眼镜重量增加10-20g）、价格也相对更亲民，镜框款式选择多样。如果只是想要一个可以随时接听电话，轻量级 AI 交互需求的眼镜，那么 AI 音频眼镜无疑是理想的性价比之选。

米家音频眼镜2

目前，市面上比较有代表性的AI音频眼镜产品包括华为智能眼镜 2 系列，米家音频眼镜系列（蜂巢科技）、GetD 能眼镜、李未可 Metalens Chat 智能眼镜等。

极简主义是 AI 音频眼镜的产品优势，不过，也是制约其拓展更多应用场景的围城。虽然华为等厂商通过生态联动、深度系统绑定来弥补这一短板，试图增强产品的竞争力，但从长远角度来看，AI音频眼镜很可能沦为“过渡性产品”，这是技术发展的必然趋势，以及现有市场的选择。

AI音频+拍摄眼镜：消费级爆款的代表形态

在 Ray-Ban Meta 系列销量超 200 万台的示范效应下，AI 音频+拍摄眼镜迅速崛起，成为当前市场主流，各大厂商追逐的标准产品形态。

相对 AI 音频眼镜，AI 音频+拍摄眼镜拓宽了信息采集维度，进一步丰富了人机交互方式。通过摄像元器件，一方面，用户可以完成第一视角摄像、摄像，甚至直播，记录生活，增强社交属性；另一方面，摄像头在与多模态 AI 大模型融合之后，可以实现视觉问答、物体识别、AI 绘画等丰富功能，全面提高生活、工作效率，进一步增强 AI 眼镜的应用场景。

摄像头模组通常放置于 “镜框” 边缘，这使得镜框内存在相应的走线。走线的存在对镜框设计形成限制，导致大多数厂商只能在颜色方面做文章，不像 AI 音频眼镜那样，在镜框设计上能为消费者提供丰富多样的风格选择。当然，一个例外是，如果一个单品眼镜达到预期量级时，为满足更多用户的多元化需求，厂商自然不会吝啬重新开模，再来几款设计。

此外，摄像头模组、ISP 等芯片元器件的增加，也加剧了眼镜的续航，增加了产品的重量。相对于 AI 音频眼镜普遍 30-40g 的重量（不含近视镜片），AI 音频+拍摄眼镜通常会再加 10g 左右，重量来到至少 40-50g；续航方面，目前，已上市的 AI 音频+拍摄眼镜连续音频续航时间为 3-4 小时，连续拍摄影像的续航时间为 0.5h-1H。鉴于此，不管是 Meta、雷鸟创新，还是闪极，都给出了一套持续「续航」的方案，如可多次充电的眼镜舱，又或者是电池颈环。

AI 音频+拍摄眼镜无疑是比普通 AI 音频眼镜场景更丰富的产品，不过，于厂商而言，AI 音频+拍照眼镜的技术难度也跟着上了一个台阶。一款眼镜，不仅需要主控芯片、扬声器、麦克风电池，由于摄像头的加入，ISP 图像处理芯片也成为了关键一环，它是成像的关键，质量直接关乎用户的体验与分享意愿。此外，单个摄像头模组还会涉及镜头、 CMOS 图像传感器等选择。

所以，为保证成像效果，以及 AI 交互效率，Meta 在第二代 AI 音频+拍摄眼镜上（Ray-Ban Meta）直接选择了集成 CPU、GPU、ISP、NPU、Engine for Visual Analytics、内存等诸多模块的骁龙 AR1 平台。虽然这款芯片一开始定位用于带显示的 AR 眼镜，Meta 似乎有一点「大材小用」，但只要市场反馈足够好，倒也无所谓。

不过，对于不少初创公司厂商而言，骁龙AR 1也并非最好的选择，毕竟 4nm 工艺芯片的 BOM +高通的 License 费用可不是一笔小数目。所以，直接采用蓝牙 MCU+ISP芯片的解决方案，也是一个相对不错的「平替」。此外，也有大厂还想继续打磨骁龙AR1，在其基础上再增加一个蓝牙主控芯片，形成双芯片+双系统的解决方案，以降低眼镜在待机时的功耗。

所以，行业内现在已经延伸出了多种 AI 拍摄眼镜的芯片解决方案。除市面上已商用落地的单 SoC 解决方案：骁龙AR1、展锐 W517 外，还有诸如：恒玄2800+研极微ISP、恒玄2800+星宸ISP、高通 AR1+恒玄 2800、MTK+恒玄 2700、物奇微 WQ7036+STM32N6 等不同芯片组合的解决方案。

一个标准的产品形态背后，可谓有数十种技术形态的组合。对于消费者而言，表面上大家看到的都是形态相似的一款款眼镜，但这背后的技术与供应链选择可谓相当繁琐，最终得到的产品体验也千差万别。「抄一款 Ray-Ban Meta 出来」，也绝对没想象中那么容易。（推荐阅读：《AI眼镜 | 供应链易入，高分产品难求》）

AI+AR眼镜：终极形态进行时

AI 眼镜的终极产品形态，无疑是 AR 眼镜，这也是 Meta 设计智能眼镜的初衷。

目前市场已形成两类主要 AR 眼镜产品形态，一类是不带摄像头的 AI 音频+AR 眼镜产品，如星纪魅族 StarV Air2、影目 Go2、Even G1（不含扬声器）等；另一类是完全体的 AI 音频+拍摄+AR 眼镜，如 Rokid Glasses、雷鸟X3 Pro、TECNO AI Glasses Pro、Meta Orion、Spectacles 24、INMO Air 3 等。

（一）「信息提示」眼镜再进一步

第一类产品技术成熟度方面具有显著优势，特别是单绿色 Micro-LED+衍射光波导的方案，产业已经探索沉淀多年，AI 大模型的加持，可进一步提高这一类 AR 眼镜产品的应用场景。

过往，这一类产品被统一归类为主打「信息提示」的眼镜产品，应用场景相对单一，但在 AI 大模型的加持下，它可以有更多的延展性。厂商可以设计诸多的 AI Agent 实现比以往 APP 形式更方便、快捷的应用场景。

星纪魅族 StarV Air2

诸如，在继承普通 AI 音频眼镜一系列语音交互的基础上，AI+AR 音频眼镜可以拓展出更精确的 AI 语音转文字功能，帮助听障人群，看见文字；AI 实时翻译，在跨国商务洽谈、国际学术交流场景中能实时打破语言壁垒；以及更准确的 AI 语音指令执行、AI 备忘录、AI 提词器等。

在芯片方面，该类轻量级 AR 眼镜通常采用可穿戴芯片，如 W4100，W5100、W517 等，因为它不仅仅需要蓝牙连接，还需要支撑一定的「显示」。W 系列芯片已广泛应用于智能手表，对于厂商而言，BOM 成本也更加可控。

（二）「顶级AI眼镜」的技术探索

相比之下，第二类 AR 眼镜产品从技术逻辑上来看更加复杂一些，它不仅要兼顾第一类产品的音频及 AR 显示技术，还要确保摄像头拍摄与 AI 技术的融合，这也是我们目前能看到 AI 眼镜的最顶级产品形态。

不管是 Meta Orion、Rokid Glasses，还是雷鸟X3 Pro 都展示了在增加摄像头之后，一系列复杂环境感知下，AI+AR 的巨大应用场景。摄像头赋予了这些 AR 眼镜实时捕捉外界图像信息的能力，结合 AI 技术，它们能够精准识别物体、场景以及人体动作等元素。

如 Meta 此前展示的个性化的 AI 助手，Meta Orion可以通过摄像头识别桌面上的所有物体，并给出一份完整的食谱建议和热量参考。由于佩戴式的眼镜设计，这让用户还可以空出双手，并获得 AR 实时显示的烹饪指导。

理想很丰满，现实很骨感。值得注意的是，在 AR 眼镜的技术逻辑里，光学、重量、续航本就是不可能三角，现在还增加一个摄像头，这让本就棘手的技术平衡难题再次雪上加霜。所以，目前已发布、亮相的这些 AR 眼镜的整体技术节奏都会更慢一些。AR 显示与摄像头的产品定义，也让高通骁龙 AR1 也几乎成了标配。

AR 光学技术方面，各家厂商在 Micro-LED 光引擎(单绿、全彩)、光波导材质（树脂、玻璃、碳化硅）、光波导工艺（纳米压印、刻蚀）的选择上都有所差异，目前暂未形成统一的技术趋势，「探索」是主旋律。

雷鸟X3 Pro

如 Rokid Glasses 由于采用了一拖二（1×Micro-LED+2×光波导）的光学方案，一定程度上降低了 BOM 成本，且单绿色 Micro-LED 微显示器较为成熟，在价格（2499元）与量产上具有一定优势；雷鸟X3 Pro 采用了全彩 Micro-LED+刻蚀工艺的光波导，标准的产业技术形态下，让其在 AR 显示上具有更加突出的色彩表现。

写在最后

从中短期、以及用户需求维度出发，AI 眼镜目前并非能用“单一形态统治市场”，而是场景分层与技术渐进的共存。

1000 元以下的 AI 音频眼镜具备极致的性价比，产品简约，虽不能做成「科技爆品」，但能成为「日用品」；
1000-2000 元价价位的 AI 音频+拍照眼镜形态凭借“够用且价格合适”的特性，仍将覆盖 50% 以上用户，满足大众市场的基本需求；
2000—5000 价位的 AR 眼镜由于集成了更为先进的 AR 光学和交互性能，可以拓展更多应用场景，对于部分极客用户与 To B 特定需求人群而言，留足了想象空间。

不过，从技术发展的趋势来看，双目全彩 AR 眼镜依旧是 AI 眼镜未来的迭代方向。类似于智能手机市场的发展逻辑，核心技术的不断突破与成本的有效控制，最终会构建起一道完整的的技术壁垒与生态空间，杀手级的应用场景也会促使消费者跟上时代的潮流。

在「百镜大战」的推动下，AR 产业的未来进程正在加速演进。

投稿/爆料：tougao@youxituoluo.com

稿件/商务合作：林南（微信 19250561593）六六（微信 13138755620）

加入行业交流群：林南（微信 19250561593）

版权申明：本文为VR陀螺原创，任何第三方未经授权不得转载。如需转载请联系微信：vrtuoluo233 申请授权，并在转载时保留转载来源、作者以及原文链接信息，不得擅自更改内容，违规转载法律必究。文中有图片、视频素材来自互联网或无法核实出处，如涉及版权问题，请联系本网站协商处理。