人工智能语音识别.ppt
《人工智能语音识别.ppt》由会员分享,可在线阅读,更多相关《人工智能语音识别.ppt(17页珍藏版)》请在优知文库上搜索。
1、语音识别语音识别目录 语音识别的定义语音识别的定义 语音识别涉及领域语音识别涉及领域 语音识别的类型语音识别的类型 语音识别原理框图语音识别原理框图 DTW算法算法 语音识别系统应用领域语音识别系统应用领域 语音识别技术的应用发展方向语音识别技术的应用发展方向语音识别的定义语音识别的定义语音识别技术就是让机器通过识别和理解过程把人类的语音信号转变为相应的文本或命令的技术,属于多维模式识别和智能计算机接口的范畴。它是语音信号处理学科的一个分支。语音识别系统的本质就是一种模式识别系统。常见的语音识别方法有动态时间归整技术(DTW)、矢量量化技术(VQ)、隐马尔可夫模型(HMM)、基于段长分布的非齐
2、次隐马尔可夫模型(DDBHMM)和人工神经元网络(ANN)语音识别涉及领域语音识别涉及领域信号处理物理学(声学)模式匹配通信及信息理论语言语音学生理学计算机科学心理学语音识别的类型语音识别的类型 孤立单词识别孤立单词识别 连续语音识别连续语音识别 连续单词识别连续单词识别 连续言语识别与理解连续言语识别与理解按识别器的类按识别器的类型型 特定人语音识别特定人语音识别 非特定人语音识别非特定人语音识别按识别器对使按识别器对使用者的适应情用者的适应情况况 有限词汇识别有限词汇识别 无限词汇识别(全音节识别)无限词汇识别(全音节识别)按语音词汇表按语音词汇表的大小的大小语音识别原理框图语音识别原理框
3、图DTW算法模板匹配方法的语音识别算法需要解决的一个关键问题是说话人对同一个词的两次发音不可能完全相同。设参考模板有M帧矢量R(1),R(2),R(m),R(M),R(m)为第m帧的语音特征矢量,测试模板有N帧矢量T(1),T(2),T(n),T(N),T(n)是第n帧的语音特征矢量。d(T(in),R(im)表示T中第in帧特征与R中im帧特征之间的距离,通常用欧几里德距离表示。三种匹配模式的对比DTW算法DTW是把时间规整和距离测度计算结合起来的一种非线性规整技术,它寻找一个规整函数im=(in),将测试矢量的时间轴n非线性地映射到参考模板的时间轴m上,并使该函数满足:D就是处于最优时间规
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 人工智能 语音 识别