首页 > 科学 > 科学探索

捷通华声发布灵云离线式语音识别技术

捷通华声发布灵云离线式语音识别技术

2013-10-22 11:36:11

来源:

  10月18日,捷通华声宣布正式推出灵云离线式语音识别(ASR)技术,该技术能力已在灵云智能人机交互能力开放平台(简称灵云平台)正式上线,用户可以到灵云平台(.hcicloud)下载、体验、使用最新灵云离线式语音识别技术。

  灵云离线式语音识别技术将包括词表识别、语法识别、“自由说”识别三个部分,由于采用了最新算法、引擎设计,识别率取得突破性提升,其中词表识别和语法识别离线语音识别率已提高到97%以上。同时,在实时率、加载时间和资源占用率等技术性能均得到大幅优化,能够很好满足目前各种移动终端的应用需求。灵云离线式语音识别技术主要应用于各种移动终端,保证用户在无网络环境下依然可以应用语音识别技术,应用语音流畅地与各种数字设备进行沟通交流。

  语音识别技术由于运算量大,目前应用语音识别技术各种智能移动终端与应用多采用“云“端语音识别技术服务。由于现实生活工作中,网络并不能覆盖所有环境,同时很多用户也担心流量增加导致使用费用的增长,因此完全依赖“云”端语音识别技术造成了用户的很大的不便。灵云离线式语音识别技术,是灵云平台“云”端语音识别技术的延伸,该项技术的推出,将有效帮助用户摆脱应用语音识别对“云”端的完全依赖,满足用户在没有网络的环境下,仍然能够方便使用语音识别技术能力。全新的灵云离线语音识别通过在智能移动终端中加载离线语音识别引擎、离线语音包,对语音进行本地化声学模型、语言模型的处理,从而使各种智能移动设备实现本地化应用和语音识别技术的需求。此次采用全新引擎的灵云离线式语音识别技术,具有识别率高、识别速度快、低运算资源占用、低内存消耗的特性,能够满足更多终端设备的使用,保证用户更好的在无网络状态下应用语音识别技术的体验与感受。

  灵云——全方位智能人机交互(HCI)能力开放平台是捷通华声全力打造的HCI技术云服务平台。灵云是一种可以用语音、手写、拍照,手势,将来甚至可使用脑波识别等智能手段来操作、感知手机、计算机等数字设备的网络云服务,其目标是让人机交互像人与人沟通一样的简单自然。灵云目前以“云 + 端”方式,为用户提供语音合成(TTS)、语音识别(ASR)、手写识别(HWR)、光学字符识别(OCR)和自然语言理解(NLU)五项核心技术能力,是目前中国、乃至世界第一个也是最大最全的HCI技术云服务平台。灵云平台致力于面向中国,未来能够向国际市场提供一个全方位HCI技术能力提供、HCI技术服务、HCI产业交流的平台。

  面对移动互联网产业的高速发展,为全面满足用户需求,捷通华声灵云平台面向开发者提供包含“云 + 端”语音识别与“云 + 端”语音合成一体化智能语音解决方案,不仅能够全面系统地满足企业与设备开发商的需求,也同时能够更好地为用户提供个性化的服务,满足用户使用不同设备、在不同应用场景下,享受智能语音交互技术带来的方便与快捷。

  目前,包含灵云离线式语音识别在内的灵云智能语音解决方案,已经为百度地图、导航犬、搜狗语音助手、嘀嘀打车、摇摇招车、快说语音助手等深受亿万大众欢迎的众多应用提供智能语音能力支持服务。为更广泛应用智能语音技术,灵云平台同时为智能家电、车联网、可穿戴式设备等领域的用户提供定制智能解决方案。相信此次灵云离线式语音识别技术的推出,必将更进一步为企业、社会大众提供更为丰富、更为全面的智能语音技术服务。

  • 相关阅读
  • 西电捷通:专注通讯安全 小型科技企业也有"春天"

      500余项国内外发明专利授权及专利申请,核心技术成为国际标准,国内无线网络安全领域的“领头羊”……看到这份沉甸甸的“成绩单”,你很难将之与一家只有110名员工的小型...

    时间:04-28
免责声明:本网对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。 本网站转载图片、文字之类版权申明,本网站无法鉴别所上传图片或文字的知识版权,如果侵犯,请及时通知我们,本网站将在第一时间及时删除。