第93届中国电子展

你所在的位置:  首页 > 官方新闻
山西见声科技有限公司人工智能助听设备
2019年04月01日
来源:CITE组委会   


见声科技由来自美国、加拿大、中国的专家及投资机构合作于2018年5月在山西转型综合改革示范区创立。注册资本1000万元。公司创始人曾就职于北美知名企业及大学,在语音识别、图像处理、深度学习、可穿戴设备等方面拥有数十年的研究开发经验,并在各自相关领域取得卓越成就。

山西见声科技有限公司为弱听及其他残障人士提供基于先进科技的辅助设备,帮助其借助科技的力量与大家正常地交流和分享。公司的业务包括人工智能、云计算、智能可穿戴设备、云服务以及创新项目。我们还通过合作伙伴参与聋人教育和康复、听障知识普及以及残障公益事业。

见声的设备可以实质性地帮助弱听及其他残障人士更加容易地获得学习、工作和生活所需要的信息,为残障人士积极参与社会活动提供必要的支撑。见声科技为“完善包括机会公平在内的社会公平保障体系”而努力。

为了加快研发速度、提高科研水平,见声特聘请2名在语音识别、图像处理、深度学习、可穿戴设备等方面拥有数十年研究开发经验,已取得卓越成就的海外专家,组建成一支20人的研发团队,其中包括4名硕士及16位技术骨干,专业范围涵盖安卓、iOS、人工智能、机器学习、嵌入式系统、可穿戴系统、工业设计等多个领域。与此同时,公司还与多所高等院校开展密切合作。见声配备有办公、研发场所面积1200平米,已建成听力实验室、人机交互验室、信号处理实验室等多个专业研究场地;并投入巨资购入深度学习平台、语音识别平台、GPU等专用设备和软件,从硬件、软件两个方面提高研发效率。

为了设计最贴合听障需求的产品,针对不同的用户群体和使用场景,见声研发了水晶音助听耳机、智能助听大屏,智能助听眼镜。

 针对轻度弱听患者,可通过手机软件和水晶音助听耳机连接,将只有在实验室和助听器制造商才能够完成的昂贵助听器,变成寻常百姓可以自己操作的自适应助听设备,简化了助听器繁琐的配戴过程,舒适、简便、经济,用户体验度良好。
 


在教学,剧场或演讲厅,我们可以使用智能助听大屏,这是一款实时语音翻译成文字的系统集成产品。尤其是聋哑学校的教学,不仅使教学从双语(口语和手语)变成了三语(口语,手语和文字),同时人机交互的扩展功能也可以辅助聋哑儿童的康复训练。三语的智能助听大屏系统也使普通学校的优质师资或社会上其他人才,投身于聋哑学校教学成为可能。使用者在使用时可以将手机屏幕上的内容通过局域网投影到电视设备上,并且可以在手机上分屏操作,一部分屏幕展示翻译文字,另一部屏幕可以做其他使用,如播放ppt。

 
中度以上的听障人士,见声开发了智能助听眼镜,这是一款全新的基于互联网的数字可穿戴计算机设备。它集成了大量最新的电子、信息、计算机和传感器技术,可以为使用者提供其他设备无法比拟的大量信息和高质量体验。

智能眼镜采用音视转化技术,在云端通过人工智能、深度学习和增强显示功能,将声音实时转化为文字,经由看见而听见!从听变看,彻底解决传统助听器“听不清、伤耳”的两大顽疾。智能助听眼镜还具有视觉提醒功能,帮助听障人士远离危险,也可以接入物联网,实现万物互联。
 


见声智能助听设备研发主要依托四大核心技术:助听云、实时语音识别、语义分析、视觉辅助。

助听云作为连接万物的核心,集成了人工智能、深度学习、音视转换、实时建模等最新科技成果。

见声目前和未来的产品,都通过见声助听云,实现视听互转,实时帮助有需要的人。见声助听云开放之后,全球传统厂商都可以通过简单的接口技术,应用见声助听云的成果,达到产品低成本升级换代、产业升级的目标。

见声水晶音助听耳机和见声智能助听眼镜是基于见声助听云的第一代产品。声音信息通过见声水晶音助听耳机、助听眼镜等终端采集并压缩加密后,上传见声助听云;经由见声助听云深度计算 ,转化为声音或者文字信息,传回显示终端。通过助听云平台的人工智能深度学习,可以将视觉、听觉互相转换。可以实现听力视觉化,视觉声音化,从而为听障、视障等残障人士提供一定的帮助。让他们的世界更加美好。
实时语音识别:见声听力测试、耳机助听直接采用手机受话器采集语音。见声智能助听、翻译眼镜采用麦克风阵列。见声针对智能助听应用环境的复杂性,开发了见声4麦阵列方案,达到国内先进水平。远场语音识别采用谷歌WebRTC技术,应用DNN 算法,配合见声和科大讯飞4麦阵列方案,基于见声专家在语音识别多年的研究,基本解决低信噪比、混响、回声消除、语音分离等一系列语音识别的技术难题,识别率高,基本满足弱听人士需求。

语义分析:总体采用云+端模式。助听云端建模、深度学习,传输到本地进行识别。简化版可以只有助听云端识别,或者只有本地识别。有网络连接就上助听云,获得最佳效果;无网络连接则本地处理,不影响正常使用。

见声听力测试和听力耳机语音识别后直接输出,不参与语义识别。见声智能助听和翻译眼镜则上助听云进行语义分析,然后返回到输出系统。

理想的语音识别,应该达到实时同步解析的效果。目前没有技术可以实现。我们采用Nuance和Kaldi双平台,通过自主研发,实时语音识别率高,完全可以满足实用要求。Nuance技术成熟,是国内语音识别技术普遍采用的平台。Kaldi是开源人工智能深度学习语音平台,代表未来的技术方向,也能更好地实现实时语音识别的功能。见声通过与谷歌专家的合作,成功在见声助听云内实现Kaldi人工智能语音学习平台。

视觉辅助:经过语义识别的文字,返回到本地,显示在弱听人士的眼前。理想的状态是无屏显示,但目前技术尚不成熟,见声公司正在跟踪相应技术。折中的方案,是采用 AR 眼镜 (增强现实眼镜),文字显示在眼镜荧幕上。作为智能硬件的落地产品,为增强现实技术提供一个实际的刚需应用。

AR眼镜的先驱是谷歌眼镜。我们采用相同的技术Google AR/VR Lullaby。既能满足当前需要,又能紧跟巨头的脚步。我们精简了97%以上的 Lullaby 原生功能,只保留了文字显示模块,并作出重大改进。未来将会独立开发基于Linux的增强显示文字。

“见声”人工智能助听设备的研发,为听障人群提供了完美的助听解决方案,明显改善听障人群的生活质量。用户覆盖整个听障人群,与此同时也促使助听行业的产业升级和产品更新换代,有效助力医疗行业、旅游、教育等行业人工智能的建设与发展。

我们还通过合作伙伴参与医疗服务、知识普及和残障公益事业。我们相信见声的设备可以帮助残障人士更加容易地获得完整无误的信息为社会做出更多的贡献。