日期:2023-04-10 05:53:57 来源:科技日报
(资料图片仅供参考)
人工智能声呐眼镜可识别唇语
准确率约为百分之九十五
【总编辑圈点】
科技日报北京4月9日电 (记者张佳欣)美国康奈尔大学研究人员开发了一款声呐眼镜,它通过声学感应和人工智能跟踪嘴唇和嘴巴的动作,可连续识别多达31条无声的命令,该系统可为那些暂时不方便说话或无法发声的人提供帮助。相关论文将在本月于德国汉堡举行的计算机协会计算系统人为因素会议上发表。
这款眼镜是一种名为EchoSpeech的无声语音识别接口。该眼镜配备了一对麦克风和比铅笔橡皮擦还小的扬声器,成为一个可穿戴的人工智能驱动的声呐系统,在面部发送和接收声波,并感知嘴巴的运动。然后,深度学习算法实时分析这些回声轮廓,准确率约为95%。这款低功耗、可穿戴的眼镜只需要几分钟的用户训练数据,即可识别命令并可在智能手机上运行。
EchoSpeech可用于在说话不方便或不合适的地方通过智能手机与他人交流,比如在嘈杂的餐厅或安静的图书馆里。无声语音界面还可与触笔配对,并与CAD等设计软件一起使用,几乎不需要键盘和鼠标。
研究人员表示,他们正在将声呐技术“搬”到人体上。它体积小、功耗低、对隐私敏感,这些都是在现实世界中部署新的可穿戴技术的重要功能。无声语音识别中的大多数技术都局限于一组选定的预定命令,需要用户面部或佩戴摄像头,这既不实用也不可行。可穿戴式摄像头也存在重大的隐私问题,对用户和与之互动的人来说都是如此。而像EchoSpeech这样的声学传感技术消除了对可穿戴式摄像机的需求。
此外,由于音频数据比图像或视频数据小得多,因此EchoSpeech只需更小的带宽,通过蓝牙实时传输到智能手机上,且数据在本地,不在云端,确保了敏感隐私信息安全。
今年以来,人工智能再次引发极大关注。几年前,专家们还在探讨如何让人工智能更加准确地理解人的意图,并与人进行多轮对话。曾经,让人工智能读懂唇语,还只是科幻电影中的桥段。如今,这些都在快速变为现实。面对人工智能带来的超乎预期的变化,不能停留在“看热闹”阶段,人们需要真正去思考,如何更好地主宰人工智能,利用它为人类造福,并尽量规避它可能带来的麻烦。
标签:
上一篇: 一季度全国铁路完成 固定资产投资1135.5亿元-快讯
下一篇: 速看:宋克柱
及时语获数千万元Pre-A+轮融资 专注打造跨境出海智能客服平台
端午诵诗文 经典永传承——花溪区委老干部局、花溪区老干部党校、花溪区老年大学联合开展端午节中华经典诵读活动 焦点报道
今日热文:聚焦现代种业发展 陕西省深入推进良种繁育基地建设
潍坊经济区城投16亿私募债项目状态更新为“已反馈”
兰州野生动物园夜场有什么项目(附夜场开放时间)
光之美少女剧场版_头条
全球速递!杜特尔特警告菲律宾战争风险:原因就是美国在菲拥有基地
又一家印度光伏制造商进军美国!
6月26日阳煤太化己二酸装置降负荷运行
老手艺也能火起来
尸字头底下一个并是什么字 尸字头下面一个衣是什么字 世界观热点
今日看点:全屋定制家具有什么缺点
走进上海体育消费节!来ISPO Shanghai 2023 畅享运动生活吧! 热讯
热消息:国内商品期市午盘多数收涨 棕榈油涨超3%
端午假期清远旅游数据出炉 多家民宿订房率九成以上|热推荐
短讯!引领鞋类设计风潮 首届“红靴奖”颁奖典礼在浙江温州举行
天天看热讯:沈铁迎来16年来最大幅度调图 释放客货运列车运力
天天热文:重庆邮局海关查获砗磲围棋子539粒
每日看点!推进“网上办”“即时办” 雄安新区营造一流营商环境
微视频|大地诗篇
哑光瓷砖怎么清理(卫生间瓷砖怎么清理干净)
佳华科技(688051.SH):正积极打造“双碳火炬基地”,并把“聊城模式”向其他城市做推广
编号7856918_编号89757mv
柬埔寨旅游签证费需要多少钱 柬埔寨签证费用 全球速读
为太阳能和数字设备提供融资服务,创企Yellow获1400万美元融资 今日热闻