主要内容

关键字定位的仿真软件万博1manbetx

这个例子显示了一个仿真软件®模型,识别关键万博1manbetx字在演讲中使用pretrained深度学习模型。这个模型被训练识别关键字“是”。学习模型的体系结构和培训,明白了关键字定位在噪音使用MFCC和LSTM网络

下载Pretrained关键词定位网络

下载并解压缩pretrained网络和标准化因素。标准化因素是全球平均值和标准偏差的功能用来训练模型。

downloadFolder = matlab.internal.examples.download万博1manbetxSupportFile (“音频”,“KeywordSpotting.zip”);dataFolder = tempdir;解压缩(downloadFolder dataFolder) netFolder = fullfile (dataFolder,“KeywordSpotting”);目录(netFolder)

模型描述

深入学习网络训练mel-frequency cepstral系数(MFCC)计算使用audioFeatureExtractor。的MFCC块模型配置为提取相同的特性,网络训练。

MFCC块提取特征向量的音频流使用分析windows 512点和384点重叠,然后一个缓冲适用于输出16个特征向量组成的39特性。缓冲特征向量能使矢量化计算有状态的分类块,使系统实时跟上(给定一个短的时间延迟)。

MFCC块,使用预先计算的标准化系数的特性,然后转置,时间是第二个维度。

有状态的分类块输出二进制决定为每个特征向量。决策转换为双打然后upsampled决定创建一个面具一样的长度对应的音频。

open_system (“keywordSpotting.slx”)

运行模型

使用手动开关块选择直播从麦克风或测试信号从一个音频文件。

sim卡(“keywordSpotting.slx”);

关闭和删除pretrained网络的路径模型。

close_system (“keywordSpotting.slx”,0);rmpath (netFolder)