文/VR陀螺 万里
今年以来,AI/AR眼镜市场热度逐渐走高,小米、阿里、HTC等品牌厂商先后发布了新品,ODM/OEM厂商也大量涌现,如果用“百镜大战”形容今年光景也丝毫不为过。
现如今AI/AR眼镜产品已经显得琳琅满目,其中涵盖了音频眼镜、拍摄眼镜、运动眼镜、翻译眼镜等众多细分品类。在这其中,视听障辅助眼镜热度也开始逐渐走高,赛道已经趋于拥挤。
AI/AR眼镜随身佩戴,并靠近人体视听中枢,因而不难想到它们可以用于改善或者提升我们的视觉以及听觉能力:眼镜搭载麦克风阵列,可将听到的内容通过文字的方式投射到屏幕当中;此外,眼镜的摄像头结合AI大模型,则可以用于充当人们的第二双眼睛。
虽说助视/助听智能眼镜偏向垂类市场,它的适用范围相较于常规智能眼镜要更窄一些。不过基于一些数据来看,这背后同样具有庞大的想象空间:
2021年,WHO发布《世界听力报告》,里面提到全球15亿人听力缺损,其中4.3亿人听力较好的耳朵存在中度或以上听力损失,需要康复和医疗干预。而到2050年,全球或将有近25亿人出现不同程度的听力问题。至少7亿人需要耳科和听力保健,以及其他康复服务。
据中国残联数据显示,截至 2023 年,我国残疾人口已达 8591.4 万,其中视力障碍人士超过 1700 万,是全球视障人数最多的国家之一。
根据VR陀螺不完全盘点,市面上的助视/助听智能眼镜品牌已经不下十家,并且还有新玩家正准备入场。下文是部分企业介绍。
这是一款字幕AR眼镜,主要服务于听力严重衰退甚至完全消失的用户群体,眼镜硬件基于Vuzix Shield,Xander团队负责相应的软件解决方案。Xander Glasses在2023年11月上市销售,售价4999美元。
主要功能方面,眼镜会采集用户周围对话声音并将转写内容呈现在屏幕当中。值得一提的是,Xander Glasses支持端侧语音转写,平常无需连接手机或WiFi即可运行,此外,转录数据也不会在眼镜或者云端进行缓存,这能够一定程度保障日常使用的私密性。
Xander曾透露,眼镜在拥挤的餐厅、城市街道和其他嘈杂环境中,识别准确率仍可达90%左右。眼镜在WiFi环境下工作续航可达6-7小时,离线使用续航则在2-3小时区间。
2023年,眼镜巨头EssilorLuxottica宣布收购Nuance Hearing,以此作为进军智能眼镜领域的跳板。Nuance Audio是企业推出的首款智能眼镜,产品聚焦于为听障用户群体(适用于轻度至中度听力损失)。
对于听障患者而言,其实市面上已经存在助听器等成熟产品,甚至Airpods Pro等设备也开发了类似的功能,不过在EssilorLuxottica看来,传统助听器外形不够优雅,不少人佩戴时会有一定心理负担,相比之下,眼镜形态产品可能是一个更加舒适且时尚的解决方案。
Nuance Audio此前曾在CES 2024/CES 2025期间有所展示,今年2月,产品先后获得了美国FDA批准以及欧盟《医疗器械法规》CE认证,这为产品顺利上市奠定了基础。
眼镜并没有配备屏幕或者摄像头,它通过定向麦克风采集环境音,再由扬声器放大传输到耳朵。目前Nuance Audio共推出了4个SKU,眼镜售价1200美元起,产品标配无线充电底座,满电状态下可使用8小时。此外,产品还可以选配遥控器,它可用于快速调节眼镜音量、音频模式以及助听设备。
Captify
这是由美国硅谷智能硬件公司Vigo Telenologies所开发的一款面向听障人士的AR眼镜,产品现已开放购买,售价699美元。
与Xander类似,Captify聚焦于重度听力损失用户。此前VR陀螺与Vigo Telenologies创始人Jason有过深度采访,具体可看:《对话硅谷AR眼镜创业者Jason:我为何会瞄准十万规模的“小市场”?》
根据Jason介绍,听障眼镜不可以盲目套用普通AR眼镜的产品开发思路,背后需要进行大量针对性设计:
1、听障群体多数年龄偏大,而他们对于智能设备操作相对不太熟练。为此,Captify开发了一键转录、一键关闭等傻瓜式操作;
2、听障群体比较习惯于大字体,眼镜需要在UI/UX方面专门做优化;
3、眼镜不会盲目过滤掉人声以外的其他环境音,相反,设备还会收集一些诸如火警、洗衣机、微波炉等提示音,这能够为用户日常生活带来更多便利;
4、眼镜采用双目异显方案,字幕可以实现动态变焦效果。
硬件方面,Captify重量43g,采用双目衍射光波导方案,最高亮度达1500尼特。产品配备两个定向麦克风,电池容量180mAh,满电状态可支持4小时连续转写。
这是一款由初创团队操刀的字幕AR眼镜,硬件基于Vizux Z100,眼镜采用单目显示,软件部分则交由团队负责。
与前面提到的产品大同小异,TranscribeGlass可转写文本并在眼镜屏幕中显示,从而给听障患者带来便利。
TranscribeGlass售价377美元,使用时需要缴纳20美元/月的订阅费用。TranscribeGlass官网介绍指出,常规的免费转写方案依赖设备内置的语音识别,但它们的准确率普遍不高:在安静环境下的准确率通常为85-88%,在有背景噪音的情况下准确率约为80%。相比之下,TranscribeGlass基于云端识别,会更加可靠。
其他方面,此前TranscribeGlass团队在接受采访时曾提到,团队正着手于开发语音语调检测功能,或许未来的听障眼镜能够更加智能,如识别对话者的情绪等。
Be My Eyes是一个全球性的公益性质辅助平台,其背后有超过600万个注册志愿者,当视障用户有需求时,可以通过摄像头连线志愿者,让志愿者们充当他们的眼睛,并获取相应的帮助。
去年9月,扎克伯格在Meta Connect大会期间介绍了Ray-Ban Meta的Be My Eyes服务,眼镜用户可通过语音指令寻求Be My Eyes志愿者的帮助。Be My Eyes CEO Mike Buckley表示:“我们与Meta的合作带来了一种全新的体验,满足了我们盲人和低视力用户群体长期以来的愿望,即解放双手使用我们的服务。”该功能已经在今年5月全面上线。
除了Be My Eyes外,Ray-Ban Meta自身也支持Live AI,今年5月,眼镜还新增了“详细回复”功能,当该功能启用后,AI能够详细的描述眼前的画面,如当你走在路上,AI会告诉你路的方向、前面的草地、湖畔、脚下是否有杂物、当前天气等等。
虽说Ray-Ban Meta并不专门面向视障群体,但是海外已经有不少相关用户开始尝试佩戴Ray-Ban Meta以解决生活当中的导航、查找物体、查看信件等问题。
XRAI AR2
XRAI成立于2022年,聚焦于开发实时转录以及翻译应用《XRAI Glass》。《XRAI Glass》除了用于海外旅游交流等用途外,服务听障用户群体也是其重要场景之一。
目前《XRAI Glass》可通过iOS以及安卓平台下载使用,此外,它还进一步适配了XRAI AR2(基于亮亮视野Leion Hey2)、雷鸟 X3 Pro、QONOQ Mirza、XREAL Air 2、XREAL One等一众智能眼镜。
XRAI AR2重量仅有49g,采用单绿Micro-LED方案,支持220多种语言的转录以及翻译,满电状态最高可以持续运行8小时。目前该眼镜在XRAI官网已经处于接受预定状态,订购价750美元。
值得一提的是,除了XRAI外,Hearsight等企业也采取了类似的策略:自身聚焦于实时转录APP开发,但也会对市面上的一些智能眼镜做适配,如Hearsight的助听眼镜硬件来自于ActiveLook ENGO 2 Clear。
Envision成立于2017年,起初曾专注于OCR图像识别软件开发,随后逐步进军视觉辅助市场。2020年初,企业曾推出过一款基于Google Glass Enterprise Edition 2平台的视觉辅助智能眼镜,产品售价1899美元起步。
今年8月,Envision宣布与智能眼镜厂商Solos达成合作,企业将基于Solos AirGo开发新一代视觉辅助AR眼镜“Ally Solos Glasses”。目前该产品已经开放预订,超级早鸟价499美元,产品将于今年10月正式发货。
Ally Solos Glasses是一款无屏AI眼镜,重量约50g。眼镜防护等级为IP67,镜腿采用可拆卸式设计,可以实现快速补电以及更换镜框款式。
软件方面,Ally Solos Glasses将会集成自家的Ally AI助手,配备文本阅读、场景描述、翻译、物体识别、AI对话等功能。
根据Envision所发布的宣传视频,Ally Solos Glasses似乎并不会处于全天候工作状态,它需要用户主动询问:我手上的传单写了什么、前面的椅子有没有人、今天会不会下雨等设备才会给予相应的回应。
.lumen盲人眼镜
.lumen是一家罗马尼亚初创企业,成立于2020年,旨在开发面向视障群体的软硬件产品,目前团队共有50多名成员。
团队正在开发一款盲人专用智能眼镜(或者说智能头盔),产品曾在CES2025、AI for Good等活动有所亮相,此外,产品于今年5月获得了CE认证,上市在即。
.lumen盲人眼镜外观有点类似于Hololens,体积相对笨重。有关资料指出,设备集成了6颗摄像头以及英伟达处理器,眼镜配备AI实时导航算法可引导用户避开障碍物。它能检测人行道、道路、交叉路口,甚至水面和冰面等特定路面。此外,眼镜还支持触觉、语音引导。设备售价尚未确定,可能会在5000-10000欧元区间。
.lumen的产品售价不菲,不过企业也在积极寻求与保险公司的合作,如果后续能够作为医疗器械推出并由医保覆盖,那么它的使用门槛会降低很多。
.lumen指出,全球视障人士数量达3.38亿(预计到2050年将达到5.35亿),但全球仅有2.8万只导盲犬。训练导盲犬的成本约为7万美元,.lumen的技术提供了一种可扩展的替代方案,可以显著提高有效行动辅助服务的可及性。
眼镜由杭州联汇科技股份有限公司研发,这是一家视觉多模态大模型公司,成立于2003年,总部位于杭州。企业曾发布了OmModel多模态大模型、OmChat、OmAgent万物具身智能体平台等产品,曾荣获2024人工智能隐形冠军企业标杆Top10等荣誉。
Homer AI助视眼镜基于其OmAgent平台构建,聚焦于为视障人群与银发一族提供解决方案。主要原理方面,眼镜摄像头会实时采集画面并上传到云端,背后基于联汇科技的Om多模态大模型技术分析用户眼前的场景信息,并返回相应的语音提示。
Homer智能助视眼镜曾在今年的老博会、WAIC 2025等活动期间有所亮相。根据官网信息,产品基于RTOS,采用多核A53超低功耗双芯片架构(8735 + 8773),支持蓝牙5.4与双频Wi-Fi。眼镜整机重量<49g,电池>150mAh,采用USB-C直充方案,并配备10000mAh拓展电源,支持更换镜片。
图源:VR陀螺
根据早些时候的新闻报道,Homer AI助视眼镜在开发过程中经历了大量优化过程。如最早的时候,AI会对看到的画面无差别播报,如“右边3米店铺正在促销”“前方1米地上有落叶”等,而这些对于视障用户而言属于非必要的干扰信息。后来,研发团队从数据训练、算法优化等方面着手对多模态大模型进行优化,试图对不同信息权重进行划分。如将“障碍物、交通信号、台阶”等设定为重要信息,“广告、植物”这类则标注成次要信息。
Homer智能助视眼镜还具有自我纠正、自我学习能力,如针对有日常用药需求的用户,眼镜在识别药品标签时,会优先播报特定的“用量”“药效”。此外,它能记住用户所用的水杯、支持智能寻物以及定目标物品进行定位提醒等。比如室内寻找盲杖,眼镜除了能基于当前画面搜索外,还能结合记忆功能加以定位:“沙发右侧1.3米处,上次出现时间为早上8点23分”。
目前设备已经处于体验官招募阶段,并已在自家微信商场上架,不过尚未开放购买。VR陀螺了解到,产品售价可能会定在3-4000元区间。
Homer智能助视眼镜宣传的五大功能
除了以上品牌外, 市面上还存在着大大小小的初创企业,它们同样瞄准视听障领域,并试图提供相应的解决方案:
亮亮视野:企业曾于2022年发布了其首款消费级AR眼镜听语者,眼镜聚焦于听障用户群体,产品采用LCoS+阵列光波导方案,目前京东平台仍有销售。今年6月,企业发布了新款AR眼镜Leion Hey2,不过新品不再聚焦于听障市场,而是服务于跨语言交流等场景。
Rokid:虽说企业最新产品Rokid Glasses并不专门服务于视障群体,不过它此前也曾宣传过相关功能,盲人佩戴眼镜后可以基于语音指令识别乐谱、智能导航、室内寻物等。
智能雷达避障眼镜:由深圳启明无障碍科技开发,眼镜重量75g。当用户前方两米左右出现障碍物时,设备会发出声音报警。眼镜本身不能用于识物,但可以配合手机摄像头解锁相关功能。眼镜已经在微信小程序上架,售价690元。
克里特智能助盲眼镜:由智能穿戴企业克里特开发,支持智能导航、实时避障、语音提示等功能。产品曾在今年的一些眼镜展会有所亮相,售价暂未明确。
图源:Rokid
虽说每个人都讨厌内卷,但是笔者看到视听障眼镜井喷反而感到庆幸:产品愈发成熟,并能给予用户切实的帮助、提升他们的生活便利以及幸福感,这是一件颇具温度的事情。
总得来看,视听辅助眼镜的爆发共有三大诱因:Envision等软件开发商的推动、智能眼镜硬件逐渐成熟以及多模态AI的应用落地。
不过从长远来看,细分市场恐怕也不会持续繁荣。辅助型眼镜与AR眼镜的关系,或许就类似于前些年的游戏手机与智能手机的关系,Meta等厂商同时掌握软硬件以及大模型优势,即便它所开发的只是普通AI眼镜,但是体验可能并不会逊色于其他垂类产品。另外,对于视障群体,智能眼镜体验更依赖于AI算法,因而AI厂商的产品在体验方面可能会有更多优势。
管中窥豹,百镜大战之火,已经越烧越旺。
投稿/爆料:tougao@youxituoluo.com
稿件/商务合作: 六六(微信 13138755620)
加入行业交流群:六六(微信 13138755620)
元宇宙数字产业服务平台
下载「陀螺科技」APP,获取前沿深度元宇宙讯息