人工智能声呐眼镜可识别唇语,准确率约为95%

七级用户 miku233 2023-4-10 1431

康奈尔大学未来交互智能计算机接口 (SciFi) 实验室的研究人员开发了声纳眼镜,可以读取用户的无声语音。


这是一种看似普通的现成眼镜,称为 EchoSpeech——一种无声语音识别界面,它使用声学感应和人工智能,根据嘴唇和嘴巴的运动连续识别多达 31 条未发声的命令。


研究人员说,这种低功耗、可穿戴的界面只需要几分钟的用户训练数据,就可以识别命令并可以在智能手机上运行。

“对于无法发声的人来说,这种无声语音技术可能是语音合成器的绝佳输入。它可以让患者重新发声,”首席研究员张瑞东谈到该技术的进一步发展的潜在用途时说。


EchoSpeech 眼镜配备了一对麦克风和比橡皮擦还小的扬声器。这有助于可穿戴式AI驱动的声纳系统在面部发送和接收声波并感知嘴部运动。然后,深度学习算法实时分析这些回波剖面,准确率约为 95%。


这种声学传感技术消除了对可穿戴摄像机的需求。由于音频数据比图像或视频数据小得多,因此需要较少的带宽来处理,并且可以通过蓝牙实时传输到智能手机。


“而且由于数据是在你的智能手机上本地处理的,而不是上传到云端,”康奈尔鲍尔斯 CIS 信息科学教授兼合著者 François Guimbretière 说,“隐私敏感信息永远不会离开你的控制。”


在目前的形式下,EchoSpeech 可用于在语音不方便或不合适的地方通过智能手机与他人交流,例如嘈杂的餐厅或安静的图书馆。当前版本的眼镜可提供 10 小时的声学感应电池续航时间,而摄像头则为 30 分钟。


 今年以来,人工智能再次引发极大关注。几年前,专家们还在探讨如何让人工智能更加准确地理解人的意图,并与人进行多轮对话。曾经,让人工智能读懂唇语,还只是科幻电影中的桥段。如今,这些都在快速变为现实。


上一篇:大佬们,全能模拟器怎么更改快捷键
下一篇:HR大群光明正大讨论裁员不给补偿方法,被人截图后集体声讨曝光者
最新回复 (8)
  • 六级用户 进站劣人 2023-4-10
    0 2
    卧槽,唇语达人要失业了。。。
  • 三级用户 Pyrrhus 2023-4-10
    0 3
    就是说以后聋哑人可以不用手语了?
  • 四级用户 逆受RED 2023-4-10
    0 4
    Pyrrhus 就是说以后聋哑人可以不用手语了?
    哑巴可能不用了,但是听力障碍人士怎么学....
  • 三级用户 Pyrrhus 2023-4-10
    0 5
    逆受RED 哑巴可能不用了,但是听力障碍人士怎么学....
    这不是眼镜么,字幕直接打在眼镜上
  • 四级用户 乱月 2023-4-10
    0 6
    进站劣人 卧槽,唇语达人要失业了。。。
    不至于。。。这些设备要平民化,起码得几十年
  • 五级用户 封初然 2023-4-10
    0 7
    还要考虑语种啊,中文没那么好适配
  • 四级用户 龙神 2023-4-10
    0 8
    牛啊,直接快进到看我脸色行事。
  • 四级用户 麻仓叶 2023-4-10
    0 9
    是时候练腹语了
    • 老男人游戏网配套论坛
      10
        立即登录 立即注册
发新帖
本论坛禁止发布SWITCH和PS4相关资源,若有其他侵权内容,请致邮3360342659#qq.com(#替换成@)删除。