主要内容

绉后处理

后处理绉音高估计网络的输出

自从R2023a

库:
音频工具箱/深度学习

描述

绉后处理块转换的输出在赫兹pretrained网络音高估计。

例子

全部展开

这个例子展示了如何使用绉块组合预处理,网络推理和后处理,得到沥青从音频信号估计。看到估计使用深音高估计块使用的一个例子深音高估计量块来执行相同的任务。

调整的参数块加速计算和实时看到音高估计音频播放。

  • 设置重叠的百分比(%)绉预处理块50。重叠比例较低,系统流程框架的频率更低。

  • 设置输出帧数绉预处理块5。这导致绉预处理块缓冲区音频帧,将他们成批绉块。通过批次绉块提高计算效率,允许并行处理多个帧。然而,这也会增加延迟因为批次的音高估计系统输出,而不是一次一个。

  • 设置模型的能力绉块。这个模型比全尺寸模型参数较少,导致更快的计算精度略低的成本。

运行模型听歌声并查看实时估计。

港口

输入

全部展开

绉网络激活,指定为一个N360年——矩阵,N由绉的帧数输出神经网络。

数据类型:|

输出

全部展开

在赫兹基本频率估计,作为一个返回N1的向量,N在输入帧的数量。

数据类型:|

参数

全部展开

信心阈值,指定为一个标量范围在[0,1)。在后处理中,块抑制基本频率的网络信心低于阈值。

请注意

如果网络输出的最大值小于阈值的信心,块的回报

可调:是的

块特征

数据类型

|

直接引线

没有

多维信号

没有

适应信号

没有

讨论二阶导数过零检测

没有

引用

[1]Kim Jong钟旭,贾斯汀班子,彼得·李和胡安-帕布鲁贝罗。“绉:卷积表示音高估计。“在2018年IEEE国际会议音响、演讲和信号处理(ICASSP),161 - 65。卡尔加里,阿瑟:IEEE 2018。https://doi.org/10.1109/ICASSP.2018.8461329。

扩展功能

C / c++代码生成
使用仿真软件生成C和c++代码®编码器™。万博1manbetx

版本历史

介绍了R2023a