语音识别的架构

语音识别的架构

语音识别系统语音识别系统是一个先编码后解码的过程,主要包括语音信号的采样和预处理部分、特征参数提取部分、语音识别核心部分以及语音识别后处理部分。

可以看下方的架构图。

 

Speech,原始语音信号

Feature Extraction,特征抽取,由原始的语音得到语音向量。

Acoustic Model、Language Model、Pronunciation Dictionary,使用声学模型和、字典、语言模型对语音向量进行解码。

特征提取、模型和搜索算法三部分构成了一个语音识别系统。也可以看这个图。从AI的架构来理解,就是:

基础层:语音信号的采集、降噪等预处理

技术层:语音的特征提取、声学模型训练、解码搜索、语言模型训练

应用层:识别结果输出

 

 

 

 

 

已标记关键词 清除标记
©️2020 CSDN 皮肤主题: 酷酷鲨 设计师:CSDN官方博客 返回首页