2026年3月25—26日,以“声态+AI”为核心主题的“2026中国国际音频产业大会(GAS2026)”在上海张江科学会堂隆重举行。大会聚焦智能眼镜、音频+AI等热门赛道,汇聚全球音频产业链企业与专家学者,共话技术创新趋势与产业发展路径。歌尔股份携智能眼镜全栈声学解决方案亮相展会,首次发布自研智能眼镜语音分离算法,系统展示“语音采集增强+沉浸式音效”全链路技术能力,为近耳终端音频体验升级提供核心支撑。
2026年政府工作报告明确提出,深化拓展“人工智能+”应用,推动新一代智能终端与智能体加快普及,为音频与智能终端产业发展提供了明确政策指引。随着AI大模型持续向终端侧下沉,智能眼镜、开放式耳机等近耳设备正成为人机交互的重要入口,消费者也对音频产品的音质表现、智能交互效率与沉浸式体验提出更高要求。而近耳声学行业长期面临复杂环境人声混叠、AI识别准确率不足、响度偏低、杂音与失真明显、临场感与空间感欠缺等共性难题,直接影响产品体验与商业化推广。
针对当前智能眼镜在复杂环境下双向对话与翻译存在的人声混叠、AI识别不准的行业痛点,歌尔在语音采集增强领域首次推出智能眼镜双路语音分离算法。该方案可适配多种MIC阵列组合,结合深度神经网络(DNN)降噪技术,能够在嘈杂场景下实时、精准拾取佩戴者与对讲人双方语音,在双向对话、实时翻译等典型场景中稳定锁定目标人声。同时集成AI智能通话降噪、VPU(骨传导)鼻托模组、立体声录音、全向/近端/远端拾音等技术,让智能眼镜在全场景下实现“降噪强、听得清、听得准、分离稳”的流畅语音交互。
在沉浸式音效方面,歌尔针对轻薄型智能眼镜体积受限、声学表现不足的行业难题,定制开发高性能扬声器,并融合低音增强、动态杂音抑制、失真消除、立体声空间化四项自研核心算法,实现低音听感等效提升3dB,杂音抑制率超过90%,失真消除率最高达80%以上,显著提升声场环绕效果,带来360°沉浸式音频体验,有效补齐轻薄智能眼镜在响度、失真控制与沉浸感上的短板。
面向产业协同,歌尔还在现场展示一站式音频工具链解决方案,覆盖算法设计、仿真调试到产品量产全流程,可将音频应用开发周期缩短约60%,助力全球行业伙伴高效推进音频产品创新与落地。
*声明:企业通稿非VR陀螺官方稿,法律问题一切与VR陀螺无关。
投稿/爆料:tougao@youxituoluo.com
稿件/商务合作: 六六(微信 13138755620)
加入行业交流群:六六(微信 13138755620)
元宇宙数字产业服务平台
下载「陀螺科技」APP,获取前沿深度元宇宙讯息