首页  »  新闻频道  »  国内新闻

无声胜有声 清华团队推出新颖唇语解读系统

2022-04-06 02:11:16

来源:科技日报

  人说话时嘴唇动作跟语音同步,可以通过识别唇动信息进行语言信息交流。唇语对讲话者友好,但是对解读唇语的听众来说却并不轻松,唇语解读一直以来是个难题,掌握唇语解读技能的成本较高。

  据了解,为降低唇语解读难度,现有技术手段常采用磁场、视觉图像、超声波等方法。以最流行的非接触式视觉图像方法为例,其唇语识别准确率较高,但依然容易受到面部角度、光强、头动和遮挡等因素干扰。特别是在此次新冠病毒流行期间,佩戴的口罩给基于视觉的唇动解读带来全新挑战。因此,通过直接捕捉面部肌肉细微动作解读唇语技术具有重要的科学研究价值与广阔的应用前景。

  如果在不久的将来,嘴唇掀动——“开门”,也许电子门禁能秒懂,马上识别身份并解锁;与汽车对话——“左拐”,或许可控制车的方向逐渐向目标移动;对于声带、喉舌损伤的失声人群,唇语可能将是一种不占用双手的、日常无障碍交流的有效方式……

  这些想法,在近日清华大学机械工程系智能与生物机械团队推出一种新颖的唇语解读系统之后,将很有可能梦想成真。相关研究成果发表在最新的《自然·通讯》期刊上。

  据了解,这项技术的主要试验和测试工作由清华机械工程系智能与生物机械实验室完成,中科院纳米能源与系统研究所的王中林院士对整个科研工作过程进行建议和指导。

  那么,究竟这项唇语解读系统的新颖之处何在?“这个基于深度学习辅助自供电柔性传感器的唇语解读技术,目标是解决声带、喉舌损伤失声人群的日常无障碍交流问题,其不占用双手,不受面部角度、光强、遮挡和头动等外部因素的干扰,新颖之处在于开发自供电的柔性传感器(灵敏度0.61183 V/kPa)采集肌肉的微小动作信号,并采用基于原型学习的深度学习模型,使用较少的数据训练,测试准确率可达94.5%,实现即时捕捉失声人群的唇动并转译成语音,可用于失声人群的日常无障碍语音交流。”3月29日,该论文第一作者、清华大学机械工程系智能与生物机械团队助理研究员路益嘉在接受科技日报记者采访时表示。

  这个唇语解读系统是否会运用大数据、人工智能等技术,突破的技术瓶颈是什么?路益嘉答道,“实现对唇动信号的识别需要用到人工智能技术和机器学习算法。在实际测试中发现,由于不同人的面部骨骼肌肉、肌肉运动形式、肌肉动作先后顺序和习惯语速等存在不同,即使是同一个词和同一句话,采集到的信号也有区别,为了得到通用的可以接受的测试准确率,需要采集海量的数据进行模型训练。然而,这样的成本偏高。”

  据介绍,研究人员没有采用训练通用模型的技术路线,而是采用训练个性化的小样本量数据模型的方法,即对每个人的每个词(或每句话)分别采集小样本量(相对海量数据而言)的数据进行模型训练,考虑到每人说话的唇动都具有独特的习惯特征,这样训练出的模型缺少通用性但更有针对性,而不考虑通用性的要求降低模型对训练数据量的需求,小样本量也能得到可接受的测试准确率。研究人员使用基于原型学习的空洞循环神经网络,来减少模型对训练样本量的需求。例如,在测试中对20个常用水果名称的唇动信号进行分类训练,每个水果名称的唇动信号选取100个样本,测试准确率达94.5%。

  这项研究将在哪些领域应用,发挥作用?“该研究通过自供电传感器采集唇动微动信号,并使用深度学习模型将信号识别为有含义的语音信号或文字信号,比较适合服务失声人群,在日常生活交流中可恢复失声人群的基本语音交流能力,并保留失声前的说话习惯。”路益嘉表示。

  此外,其还可应用于个人身份识别。研究人员制作出一个唇动指令开门的应用演示。由于该方法融合特定密码口令的静态特征和个人特殊的唇部动态特征,可以实现双重特征验证,特别是戴口罩不发声说密码的方式可进一步提升系统安全性,适用于安全验证要求较高的场合。

  该研究成果还可用于人机交互的研究。研究人员制作出一个唇动信号控制模型车运动方向的应用演示,通过检测唇动发出的方向指令,机器模型车可改变行进方向。这为现有人机交互方案提供了新的可能性。

  本报记者 华 凌

  • 相关阅读
  • 专家:方舱医院要配备一定比例的医务人员、医疗检测设备等

      中新网4月6日电 北京大学第一医院感染疾病科主任王贵强今日表示,在管理无症状感染者和轻型病例时一定要有医务人员在场,在方舱医院里要安排医务人员和必要的诊疗设备,包括抢救设备、基本用药等等。  6日下午...

    时间:04-06
  • 核酸检测规模激增 专家介绍检测中个人注意事项

      核酸检测规模激增 检测中个人注意事项有哪些→  今天(4月6日)下午,国务院联防联控机制举行新闻发布会。会上,北京大学第一医院感染疾病科主任王贵强介绍,核酸检测整个过程非常复杂,个体来讲,注意几个方面:...

    时间:04-06
  • 我国多点散发疫情状况会维持多久?吴尊友这样说

      中新网4月6日电 对于我国多点散发疫情状况会维持多久,6日,中国疾控中心流行病学首席专家吴尊友回应表示,这取决于我们的防控策略、以及防控措施落实的力度。  6日,国务院联防联控机制就从严从实抓好疫情防控...

    时间:04-06
  • 中国疾控中心:我国“外防输入”压力大 要严格坚持“四早”

      今天(4月6日)下午,国务院联防联控机制举行新闻发布会。会上,中国疾控中心流行病学首席专家吴尊友介绍,近期呈现的多点多面的疫情形势持续多长时间,取决于防控策略以及防控措施落实的力度。  由于受全球第四...

    时间:04-06
  • 陕西对省市常委班子成员监督清单化

      健全违规决策责任追究机制 推进廉政谈话全覆盖  陕西对省市常委班子成员监督清单化  记者 杜瑶  “省委‘一把手’每年至少同下级‘一把手’开展1次监督谈话并全覆盖;省纪委每年至少向省委常委班子成员通报...

    时间:04-06
  • 国家卫健委:全国3.8万余名医务人员支持上海

      中新网客户端4月6日电(记者 袁秀月) 6日,国务院联防联控机制召开新闻发布会。国家卫健委新闻发言人米锋介绍,近期,上海疫情发展迅速,疫情防控正处在关键时期。按照党中央、国务院决策部署,国家卫生健康委已从...

    时间:04-06
  • 方舱医院主要收治无症状感染者和轻症病例

      北京大学第一医院感染疾病科主任王贵强6日在国务院联防联控机制新闻发布会上表示,方舱医院主要收治无症状感染者和轻症病例,无急性发作的基础疾病和精神疾病患者。对轻症病例给予中药等对症治疗,对有重症高风险...

    时间:04-06
  • 国家卫健委:3月以来全国累计报告本土感染者176455例

      中新网4月6日电 谈及当前全国总体疫情形势,国家卫生健康委疾控局副局长、一级巡视员雷正龙6日下午在国务院联防联控机制举行的发布会上表示,3月1日-4月5日,全国累计报告本土感染者176455例,波及29个省,总体呈...

    时间:04-06
  • 北京市顺义区人大常委会原副主任盛德利被“双开”

      中央纪委国家监委网站讯 据北京市纪委监委消息:日前,经北京市委批准,北京市纪委监委对北京市顺义区人大常委会原党组成员、副主任盛德利严重违纪违法问题进行了立案审查调查。  经查,盛德利对抗组织调查,串...

    时间:04-06
  • 王华庆:有花粉过敏史不是接种新冠病毒疫苗的禁忌

      中国疾控中心免疫规划首席专家王华庆6日在国务院联防联控机制新闻发布会上表示,春季是花粉过敏的高峰期,有花粉过敏史不是接种新冠病毒疫苗的禁忌。只有接种新冠病毒疫苗过敏的或对新冠病毒疫苗中成分过敏或既往...

    时间:04-06
免责声明:本网对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。 本网站转载图片、文字之类版权申明,本网站无法鉴别所上传图片或文字的知识版权,如果侵犯,请及时通知我们,本网站将在第一时间及时删除。