您当前的位置:首页 > 电脑百科 > 人工智能

新技术不断刷新我对测试工作的认知!如何进行机器语音交流测试?

时间:2020-08-14 10:02:08  来源:  作者:

与机器进行语音交流,让机器明白你说什么,是人们长期以来梦寐以求的事情,随着AI人工智能技术的实现,语音识别技术已经开始在各个领域应用。而如何验证机器是否正确采集并识别语音,在测试领域又是一个新兴的课题。下文将阐述如何针对语音语义识别技术进行测试。

一、什么是语音&语义

假设我们对某AI说了心事,那机器该怎么理解我们所说的呢?首先机器会对我们发出的语音信息进行识别,语音识别就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的技术。语音识别技术主要包括特征提取技术、模式匹配准则及模型训练技术三个方面。特征提取技术可以对某一模式的组测量值进行变换,以突出该模式具有代表性的特征,并通过影像分析和变换,以提取所需的特征,而通过模式匹配准则,我们就可以精准的在模板库里锁定特征,然后通过大量模型训练形成语音识别模型。这样可以让机器明白了我们说的文字是什么,而机器不是人,那对自然语言的识别和理解就是语义识别技术需要解决的问题。

语义识别就是将连续的讲话分解为词、音素等单位,并建立起一个理解语义的规则,并把其中分解出来的某一个词作为关键词,当语义识别出来关键词的时候,返回识别结果。语义识别的核心除了理解文本词汇的含义,还要理解这个词语在语句、篇章中所代表的意思,这意味着语义识别从技术上要做到:文本、词汇、句法、词法、篇章层面的语义分析和歧义消除,以及对应的含义重组,以达到识别本身的目的。

新技术不断刷新我对测试工作的认知!如何进行机器语音交流测试?

 

二、语音&语义识别应用场景

语音和语义识别技术可以分析网页、文件、邮件、音频、论坛、社交媒体中的大量数据,也可以直接应用于医疗、教育、金融等行业。还可以通过技术接口应用于所有智能语音交互场景,如智能家居、车载语音、可穿戴设备、VR、机器人等。

医疗场景,为医疗专业人士提供实时语音听写、电子病历录入,也可以让医疗专业人士,通过对症状的描述,关键词查询,进行病症的初步判断,分类科室、辅助诊断等。

教育场景,基于自然语言处理技术进行口语能力的测评,同时也可以通过人工智能技术,题库系统,以及算法模型,根据学生在测试中对上一道问题的回答情况,自动调整学生接下来所需回答问题的难度和顺序,以达到让每一个学生拥有最合适的学习方案

金融场景,运用自然语言处理,深度学习等多种AI技术,进行量化交易模型的建立来量化交易,以更强大的计算机模型运用人工智能的技术对大量客户进行财富画像,为客户量身定制的资产管理投资的智能投顾。

商业场景,基于系统数据库、知识图谱,在与客户的对话中,获取客户需求,并提供相应的答案来解决客户的问题。

营销场景:通过各种算法模型,对用户在互联网上留下的大量个人信息、登录信息、路径关系、社交关系、消费记录等数据进行数据挖掘,来对用户进行精准需求分析,自动化营销。

新技术不断刷新我对测试工作的认知!如何进行机器语音交流测试?

 

三、语音&语义识别模型测试方法

1.语音&语义识别功能的测试标准

在常规的测试内容中我们会对模型的接口调用连通性、参数非法校验、返回码正误等等进行测试,而最重要的是测试模型的识别效果。因此语音&语义识别功能的测试通过标准有两个,第一是模型接口可以成功调用,而且会对无法识别的语音信息于前端进行错误抛出;第二就是模型的识别结果准确率达到通过准则(大量的语音信息,语音的模糊性和环境噪声都会对模型的识别造成困扰,很难做到每一次都能识别成功。虽然模型训练追求完美,但目前却无法保证100%的正确,因此一般来说准确率就是各自场景的使用人员自行决定准确率通过准则,业界的通用标准是语音识别准确率达到99%以上)

2.语音&语义识别功能的测试流程

我们以某掌银的导航和转账业务为例,下图展示了测试模型识别效果的主要流程。首先需要准备一定量的数据(当数据量越大的时候,模型的训练效果越好)分为两个部分,一部分是语音测试数据,一部分是语义测试数据。其中语音测试的数据都是提前录好的对应文字的语音,语义测试的数据是包含意图关键词的语料文档,两部分的数据都包含导航和转账两个业务场景的语句。

新技术不断刷新我对测试工作的认知!如何进行机器语音交流测试?

 

把录制的语音文件发送至“语音识别模型”,返回语音识别的结果,并根据识别的结果出具一个语音识别的准确率,其中包含接口请求的成功率,字准率(识别正确的字符数/评测集所有字符数)和句准率(全部识别正确的句子数目/评测集所有句子数),并将该结果装载至“语义识别模型”,返回语义识别结果,同样出具一个语义识别准确率,即词准率(正确识别出的某类关键词(例如意图)/评测集所有某类关键词数(例如意图)),语音和语义识别的准确率即为模型效果评价指标的方式。

新技术不断刷新我对测试工作的认知!如何进行机器语音交流测试?

 

以下图中第一条自造数据为例,当客户说出我要转账给丁某三十元的时候,把语音识别模型识别出来的结果装载至语义识别模型,语义识别模型提取关键字“转账”、“丁某”、“三十元”,对应意图“TRANSFER”、人名以及金额,即可识别出来客户需要给丁扬转账30元,当该条转账的操作可以成功完成即测试通过。

新技术不断刷新我对测试工作的认知!如何进行机器语音交流测试?

 

当导航和转账的自造数据通过批量运行脚本都成功加载至语音识别模型和语义识别模型,并在语音识别模型得到了相应的字准率和句准率,且两个准确率均能达到99%以上的时候,我们可以判定语音识别是成功的,同理,在语义识别模型里,得到的词准率也能达到99%以上的时候,语义识别也是成功的。通过字准率,句准率,词准率,我们可以认为该语音语义识别模型的效果是符合业界标准的,同时也达到了测试通过准则。



Tags:机器语音交流测试   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,如有任何标注错误或版权侵犯请与我们联系(Email:2595517585@qq.com),我们将及时更正、删除,谢谢。
▌相关推荐
与机器进行语音交流,让机器明白你说什么,是人们长期以来梦寐以求的事情,随着AI人工智能技术的实现,语音识别技术已经开始在各个领域应用。而如何验证机器是否正确采集并识别语音...【详细内容】
2020-08-14  Tags: 机器语音交流测试  点击:(65)  评论:(0)  加入收藏
▌简易百科推荐
作为数据科学家或机器学习从业者,将可解释性集成到机器学习模型中可以帮助决策者和其他利益相关者有更多的可见性并可以让他们理解模型输出决策的解释。在本文中,我将介绍两个...【详细内容】
2021-12-17  deephub    Tags:AI   点击:(15)  评论:(0)  加入收藏
基于算法的业务或者说AI的应用在这几年发展得很快。但是,在实际应用的场景中,我们经常会遇到一些非常奇怪的偏差现象。例如,Facebook将黑人标记为灵长类动物、城市图像识别系统...【详细内容】
2021-11-08  数据学习DataLearner    Tags:机器学习   点击:(32)  评论:(0)  加入收藏
11月2日召开的世界顶尖科学家数字未来论坛上,2013年诺贝尔化学奖得主迈克尔·莱维特、2014年诺贝尔生理学或医学奖得主爱德华·莫索尔、2007年图灵奖得主约瑟夫·斯发斯基、1986年图灵奖得主约翰·霍普克罗夫特、2002...【详细内容】
2021-11-03  张淑贤  证券时报  Tags:人工智能   点击:(39)  评论:(0)  加入收藏
鉴于物联网设备广泛部署、5G快速无线技术闪亮登场,把计算、存储和分析放在靠近数据生成的地方来处理,让边缘计算有了用武之地。 边缘计算正在改变全球数百万个设备处理和传输...【详细内容】
2021-10-26    计算机世界  Tags:边缘计算   点击:(45)  评论:(0)  加入收藏
这是几位机器学习权威专家汇总的725个机器学习术语表,非常全面了,值得收藏! 英文术语 中文翻译 0-1 Loss Function 0-1损失函数 Accept-Reject Samplin...【详细内容】
2021-10-21  Python部落    Tags:机器学习   点击:(43)  评论:(0)  加入收藏
要开始为开源项目做贡献,有一些先决条件:1. 学习一门编程语言:由于在开源贡献中你需要编写代码才能参与开发,你需要学习任意一门编程语言。根据项目的需要,在后期学习另一种语言...【详细内容】
2021-10-20  TSINGSEE青犀视频    Tags:机器学习   点击:(37)  评论:(0)  加入收藏
SimpleAI.人工智能、机器学习、深度学习还是遥不可及?来这里看看吧~ 从基本的概念、原理、公式,到用生动形象的例子去理解,到动手做实验去感知,到著名案例的学习,到用所学来实现...【详细内容】
2021-10-19  憨昊昊    Tags:神经网络   点击:(47)  评论:(0)  加入收藏
语言是人类思维的基础,当计算机具备了处理自然语言的能力,才具有真正智能的想象。自然语言处理(Natural Language Processing, NLP)作为人工智能(Artificial Intelligence, AI)的核心技术之一,是用计算机来处理、理解以及运...【详细内容】
2021-10-11    36氪  Tags:NLP   点击:(48)  评论:(0)  加入收藏
边缘计算是什么?近年来,物联网设备数量呈线性增长趋势。根据艾瑞测算, 2020年,中国物联网设备的数量达74亿,预计2025年突破150亿个。同时,设备本身也变得越来越智能化,AI与互联网在...【详细内容】
2021-09-22  汉智兴科技    Tags:   点击:(54)  评论:(0)  加入收藏
说起人工智能,大家总把它和科幻电影中的机器人联系起来,而实际上这些科幻场景与现如今的人工智能没什么太大关系。人工智能确实跟人类大脑很相似,但它们的显著差异在于人工智能...【详细内容】
2021-09-17  异步社区    Tags:人工智能   点击:(57)  评论:(0)  加入收藏
相关文章
    无相关信息
最新更新
栏目热门
栏目头条