您当前的位置:首页 > 电脑百科 > 程序开发 > 算法

语音识别算法(ASR)测试设计

时间:2020-12-23 09:53:25  来源:  作者:
语音识别算法(ASR)测试设计

 

如上图,我们通过微信发送了一段语音,在对语音进行转文字时。语音识别引擎首先会将把这段语音进行分帧(切分成若干小段),然后利用声学模型将提取的每一帧的声学特征识别为一个个“状态”,多个状态会组合成一个音素(语音中的最小的单位),音素构成了诸多同音字,再利用 语言模型 从诸多同音字中挑选出可以使 语义完整的字(例如 不会把“吃饭”识别成“痴泛”),最后将文本展示出来。

 

如何将上述过程从质量的角度刻画出来,是本框架解决的主要问题。同时,AI算法测试依托纯手工测试、亦或是半自动化测试所面临着在执行效率、结果可靠性方面的局限性较大,本框架也是从手动、半自动测试转变为全自动、智能化测试的一次尝试。

 

我们需要解决的重点问题

  • 基于文本相似度计算及标注质量风险等级阈值设置,实现语音标注质量的风险自动评估。
  • 基于SER(句错误率)、WER(字错误率)、字错误前提下的音节错误率、字错误且音节正确前提下的音调错误率 指标,实现宏观指标的自动评估(每条标注信息分析精确到每个字的结果分析(正确、编辑、删除、插入)、每个错字的音节、音调分析)。
  • 基于标注数据意图(场景)的划分,实现各意图指标的自动评估。
  • 基于标注数据各维度(如,发音人性别、信噪比等),实现各维度指标的自动评估。
  • 基于由字符到音节再到音调的深层次的启发式分析,更好的启发测试同学发现问题。

 

重难点分析

重点分析

  1. 给出宏观的WER、SER指标结果,以及每条标注的数据WER结果。
  2. 给出不同维度的WER、SER指标结果,并且与期望指标值进行比对,给出结论。

难点分析

1 如何实现标注质量的自动评估

标注质量差意味着期望值错误,将直接决定了后续统计结果的可靠性,音频的标注进行质量评估是开展统计分析的前提。因此需要实现对所有标注数据进行标注质量风险评级,并输出整体标注质量情况。

 

如何实现将每个标注数据进行精确到字、音节、音调的分析,找出其中正确的字、编辑的字、删除的字、插入的字,并且将标注与识别文本标注对齐。例如:

标注文本(预期):  二三四五六七八九十 
识别文本(实际):  一二三四五七捌九玖十

通过人工判断可以得出:

  • 正确的字(C):二三四五七九十
  • 编辑的字(S):捌
  • 删除的字(D):六
  • 插入的字(I) :一、玖

有同学也许会问,为什么捌是编辑、玖为什么是插入?这里答疑一下:

  • “捌” 属于编辑是因为在识别文本中,“捌”前面是“七”、后面是“九”。而标注文本的七和九之前刚好有一个字,因为这个字和捌不一样,所以是编辑。
  • “玖”属于插入是因为在识别文本中,“玖”前面是“九”后面是“十”,而标注文本“九”和“十”之间没有任何字,所以是插入。

3 如何实现基于字错实现由字、到音节、再到音调的深层次分析挖掘,例如,按照如下梯度进行分析:

语音识别算法(ASR)测试设计

 

效果

测试框架通过配置待测试的标注数据集,自动实现以下结果的输出。

1 模型宏观指标

宏观指标包含 质量风险评估、SER、WER等指标计算及与预期指标值的比对结果,帮助测试人员从宏观角度快速掌握本次任务测试数据集的指标结果。

语音识别算法(ASR)测试设计

 

关于评估指标的计算,可以浏览下该文章内容:

AI算法测试——语音识别(ASR)模型评估指标探索

数据标注质量风险评估

通常,人工标注的文本数据与期望数据的相似度越高,那么说明标注质量越高(可能是误读,导致存在一定误差,但属于小概率事件),我们通过文本相似度计算(切词、余弦相似度)实现标注质量的风险预测。

数据标注质量风险评估包含录音文本、归一化文本、标注人员工号、质量风险等级信息,帮助测试人员快速摸清数据标注质量,以及提高对于高风险标注数据的纠正效率。

语音识别算法(ASR)测试设计

 

3 语音测试样本的数据统计分析详情

全量语音识别的统计分析结果中包含每条标注数据的基本信息,结果比对的统计信息,以及精确的字、音、调的分析,帮助测试人员快速直观的了解每一条标注信息标注结果,提高分析效率。

语音识别算法(ASR)测试设计

 

关于这部分实现,可以浏览下该文章内容:

语音识别算法(ASR)指标评估之编辑距离下WER计算图解

4 意图(场景)统计分析

意图统计分析结果包含各意图的字错率、句错率,以及与预期指标值的比对结果,帮助测试人员了解不同意图(场景下)的指标表现。

语音识别算法(ASR)测试设计

 

5 其他维度统计分析

其他维度只要包含标注数据时打标的字错率、句错率,以及与预期指标值的比对结果各项维度,帮助测试人员了解不同数据特征下的指标表现,同时支持配置即统计(只需要配置到运行配置中,即可实现统计,无需代码开发)

语音识别算法(ASR)测试设计

 

6 错字前提下,音节正确分析详情

由字符到音节,从错字的角度出发,进行更深层次的启发式分析,包含期望字、期望字音节、多音字读音,对应的错字数量,具体的每一个错字,字的来源等信息,通过数据归并统计分析,启发测试人员从中发现更多的问题。

语音识别算法(ASR)测试设计

 

7 错字且音节正确前提下,音调正确分析详情

同音字分析,由音节到音调,这是基于错字且音节正确前提下更深一步的启发式分析,包含了期望字、期望字音节、多音字读音、期望音调,对应的错字数量、错字音调等信息,通过数据归并统计分析,启发测试人员从中发现更深入的问题。

语音识别算法(ASR)测试设计

 

8 错字且音节正确前提下,音调错误分析详情

由音节到音调,这是基于错字且音节正确前提下更深一步的启发式分析,包含了期望字、期望字音节、多音字读音、期望音调,对应的错字数量、错字音调等信息,通过数据归并统计分析,启发测试人员从中发现更深入的问题。

语音识别算法(ASR)测试设计


Tags:语音识别算法   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,如有任何标注错误或版权侵犯请与我们联系(Email:2595517585@qq.com),我们将及时更正、删除,谢谢。
▌相关推荐
语音识别的研究历史悠久,出现了许多著名的算法和工具。从事语音算法工作两年期间,我在语音识别方向做了一点工作,对此有一些体会。面对诸多的算法如何学习掌握呢?我认为一个不错...【详细内容】
2021-08-11  Tags: 语音识别算法  点击:(76)  评论:(0)  加入收藏
如上图,我们通过微信发送了一段语音,在对语音进行转文字时。语音识别引擎首先会将把这段语音进行分帧(切分成若干小段),然后利用声学模型将提取的每一帧的声学特征识别为一个个...【详细内容】
2020-12-23  Tags: 语音识别算法  点击:(419)  评论:(0)  加入收藏
▌简易百科推荐
前言Kafka 中有很多延时操作,比如对于耗时的网络请求(比如 Produce 是等待 ISR 副本复制成功)会被封装成 DelayOperation 进行延迟处理操作,防止阻塞 Kafka请求处理线程。Kafka...【详细内容】
2021-12-27  Java技术那些事    Tags:时间轮   点击:(1)  评论:(0)  加入收藏
博雯 发自 凹非寺量子位 报道 | 公众号 QbitAI在炼丹过程中,为了减少训练所需资源,MLer有时会将大型复杂的大模型“蒸馏”为较小的模型,同时还要保证与压缩前相当的结果。这就...【详细内容】
2021-12-24  量子位    Tags:蒸馏法   点击:(9)  评论:(0)  加入收藏
分稀疏重建和稠密重建两类:稀疏重建:使用RGB相机SLAMOrb-slam,Orb-slam2,orb-slam3:工程地址在: http://webdiis.unizar.es/~raulmur/orbslam/ DSO(Direct Sparse Odometry)因为...【详细内容】
2021-12-23  老师明明可以靠颜值    Tags:算法   点击:(7)  评论:(0)  加入收藏
1. 基本概念希尔排序又叫递减增量排序算法,它是在直接插入排序算法的基础上进行改进而来的,综合来说它的效率肯定是要高于直接插入排序算法的;希尔排序是一种不稳定的排序算法...【详细内容】
2021-12-22  青石野草    Tags:希尔排序   点击:(6)  评论:(0)  加入收藏
ROP是一种技巧,我们对execve函数进行拼凑来进行system /bin/sh。栈迁移的特征是溢出0x10个字符,在本次getshell中,还碰到了如何利用printf函数来进行canary的泄露。ROP+栈迁移...【详细内容】
2021-12-15  星云博创    Tags:栈迁移   点击:(19)  评论:(0)  加入收藏
一、什么是冒泡排序1.1、文字描述冒泡排序是一种简单的排序算法。它重复地走访要排序的数列,一次比较两个元素,如果他们的顺序错误就把他们交换过来。走访数列的工作是重复地...【详细内容】
2021-12-15    晓掌柜丶韶华  Tags:排序算法   点击:(16)  评论:(0)  加入收藏
在了解golang的map之前,我们需要了解哈希这个概念。哈希表,又称散列表(Hash table),是根据键(key)而直接访问在内存储存位置的数据结构。也就是说,它通过计算出一个键值的函数,将...【详细内容】
2021-12-07  一棵梧桐木    Tags:哈希表   点击:(13)  评论:(0)  加入收藏
前面文章在谈论分布式唯一ID生成的时候,有提到雪花算法,这一次,我们详细点讲解,只讲它。SnowFlake算法据国家大气研究中心的查尔斯·奈特称,一般的雪花大约由10^19个水分子...【详细内容】
2021-11-17  小心程序猿QAQ    Tags:雪花算法   点击:(24)  评论:(0)  加入收藏
导读:在大数据时代,对复杂数据结构中的各数据项进行有效的排序和查找的能力非常重要,因为很多现代算法都需要用到它。在为数据恰当选择排序和查找策略时,需要根据数据的规模和类型进行判断。尽管不同策略最终得到的结果完...【详细内容】
2021-11-04  华章科技    Tags:排序算法   点击:(37)  评论:(0)  加入收藏
这是我在网上找的资源的一个总结,会先给出一个我看了觉得还行的关于算法的讲解,再配上实现的代码: Original author: Bill_Hoo Original Address: http://blog.sina.com.cn/s/bl...【详细内容】
2021-11-04  有AI野心的电工和码农    Tags: KMP算法   点击:(36)  评论:(0)  加入收藏
相关文章
    无相关信息
最新更新
栏目热门
栏目头条