您现在的位置: 首页 > 网站导航收录 > 百科知识百科知识
人工智能语音识别系统可以用到客服/报警/抢救电话里面吗?为什么?
语音,人工智能,客服人工智能语音识别系统可以用到客服/报警/抢救电话里面吗?为什么?
发布时间:2019-02-08加入收藏来源:互联网点击:
人工智能语音识别系统可以用到客服/报警/抢救电话里面吗?为什么?
回答于 2019-09-11 08:43:50
回答于 2019-09-11 08:43:50
人工智能语音识别系统可以用到客服/报警/抢救电话应用里。
人工智能语音识别系统原理
语音识别技术就是让机器通过识别和理解过程,把语音信号转变为相应的文本或命令的技术。语音识别涉及的领域包括:数字信号处理、声学、语音学、计算机科学、心理学、人工智能等,是一门涵盖多个学科领域的交叉科学技术。语音识别的技术原理是模式识别,其一般过程可以总结为:预处理---特征提取---基于语音模型库下的模式匹配---基于语言模型库下的语言处理---完成识别。
现在的智能手机大多已经具备了语音拨号、语音记事本、语音遥控器等功能,人们可以通过语音识别对话系统查询相关信息,并且取得了很好的成果。全自动电话语音机器人,同样采用了此项技术,目的是让机器人具备“听”的能力,并在此基础上,又添加了语音合成、声纹识别等生物识别技术,从而在与人类对话中,能实现流畅自然的交流。
下面我们来看看人工智能语音识别在客服、报警等方面的应用价值。
人工智能语音识别的应用
1、人工智能语音识别在客服中的应用
人工智能语音识别在客服中最常见的应用是智能语音客服系统。
智能语音客服系统可通过开放式的提示来询问用户,在交互过程中,用户可以随时说话打断,自然的说出需求,而无需等待提示语结束,使用户和系统间的交流更加快捷、自然。系统能够自动判断用户说话的起止,配合智能打断并及时停止播放提示语。呼叫导航技术具有全面的自然语言理解能力,通过分析用户自然对话中的关键语义,能够自动判断其需求,从而提供最适当的信息或服务。借助这些领先技术,语音自助服务应用可以提供更自然的交互体验,带来更高的客户满意度,并实现更高自动化水平。
比如:银行、保险、电信、电商等行业都具备这大量的用户规模,这些行业的呼叫中心为了能够有效提高工作的效率以及客户的满意度,已经逐渐开始从传统的人工服务方式升级为智能的客户服务系统,相比于传统的服务模式会更加快捷、智能以及高效。
智能语音系统的识别模块不仅可以有效识别客户的语音,并将语音识别结果进行反馈,可以为客户提供优质的语音导航功能。智能语音系统的应用主要表现在三个方面:
第一个是智能IVR互动式语音应答,该功能可以在用户说出自己的服务需求之后,自动匹配到相应的数据库,为用户检索所需要的信息。
第二个是智能语音服务,该功能可以根据客户的业务需求,转接到相应的问题解答知识库,通过语音的方式将信息传递给客户。
第三个是对用户进行身份的校验,对于一些比如银行业、保险业需要提前进行身份确认的服务,系统可以通过语音识别对用户的身份进行确认,从而保障用户信息的安全性。
2、人工智能语音识别在报警中的应用
人工智能语音识别在报警中最常用的应用是音视频监控。
生活中,我们比较常见视频监控设备,但是大多数视频监控系统无法拾取音频,所以此时需要智能语音识别系统来拾取视频监控中的语音。这对于音视频一体化监控来说,摄像机是眼睛,语音识别系统是耳朵。眼睛看到的图像和耳朵听到的声音通过电缆、光纤、网络等神经系统传输到作为大脑的云台再发出指令完成报警。
总结
从以上分析,我们可以看到,人工智能语音识别皆是通过对声音的采集到识别处理后,进行语音交互或者语音拾取,从而为不同的场景提供语音理解和翻译。
信息创造价值,学习使人进步。
我是泰瑞聊科技,为您打开科技生活,感谢您阅读与关注!
回答于 2019-09-11 08:43:50
语音作为一个交互入口,最近几年发展的很好,但是应用上目前的程度是无法彻底取代人力的。
从上述三个应用场景中:
客服目前已经存在使用人工智能语音技术,但是现阶段仍属于以节约人力为目的,而非取代人力。例如,因为有了人工智能语音技术,可以一个客服同时服务多个客户,或者在半夜无人时段,或者高峰期人员不足时段用于人力补充。
但是报警和抢救目前还没有出现即使是以人工智能语音技术为辅助的场景应用。原因很简单,目前的人机对话的准确率和召回率并不足矣不遗漏任何信息,而这两个场景对于信息的处理速度以及准确度要求非常高。
人机对话由以下部分组成:
目前主要导致人机对话处理信息遗漏的环节有以下内容:
ASR(Automatic Speech Recognition),即自动语音识别技术,类似于人的耳朵,该环节会将接收到的语音信号,转换为文本信号,这样才能让计算机做后续的处理。
NLU(Natural Language Understanding),即自然语言理解,类似于人的大脑,该环节会通过文本内容,上下文逻辑,理解说话者的真实意图。
ASR环节造成信息遗漏
上表中列出的是当前ASR的主要流程细节,我们一样一样来说。
背景噪音导致VAD无法准确响应,由于电话一般采用单声道进行通信,完全依赖手机本身对于音频的降噪处理。中国人口众多,贫富差别较大,在公共设施的110和120上要尽量满足对各种噪音环境下保证服务的速度和准确度。
语音模型,简单的说就是将语音转成拼音。先不考虑外国人如何打110或者120,先说中国人。我国是一个多民族、多语言、多文种的国家,有56个民族,共有80种以上语言,30种文字。而当前各家ASR服务商采用的模式是需要预先告诉系统,说话人是什么方言,然后服务器调用对应的引擎进行识别,无法对所有语音,并且可能夹杂各种口音的语言进行准确识别。
语言模型,简单的说就是看拼音写汉字。这个很多人感觉很简单,但是你要支持就算语音模型将各个方言可以准确无误进行识别,但是依旧无法满足所有语言的语序问题,就好比山东话虽然易懂,但是山东人喜欢说倒装句,在同样语音下容易造成填字错误。
上一篇:打什么药物羊不再去地吃麦苗?
下一篇:返回列表
相关链接 |
||
网友回复(共有 0 条回复) |