kapre是Keras音频预处理器,用于在GPU上实时计算STFT,ISTFT,Melspectrogram。
在Python 3.6和3.7上通过测试。 为什么选择Kapre?与预计算 您可以优化DSP参数 您的模型部署变得更加简单和一致。 您的代码和模型具有更少的依赖性
与您自己的实现 快捷方便! 与1D / 2D张量流批处理形状一致 数据格式不可知(channels_first和channels_last) 更少的错误倾向-Kapre层针对Librosa(stft,decibel等)进行了测试-(请相信我)这比您想象的要棘手。 Kapre层具有一些默认tf.signals实现的扩展API,例如:
一个完全可逆的STFT和InverseSTFT对 梅尔频谱图具有更多选择 Kapre的工作流程预处理音频数据集。以正确的采样率重新采样音频并存储音频信号(波形) 在您的ML模型中,添加Kapre层,例如kapre.time_frequency.STFT()作为模型的第一层。 数据加载器只需加载音频信号并将其输入模型 在您的超参数搜索中,包括DSP参数n_fft以提高性能 部署最终模型时,您只需要记住信号的采样率即可。没有依赖关系或预处理!
安装pip install kapre 或者下载我们备份的kapre库文件包。 API文档请参阅 kapre.readthedocs.io上的Kapre API文档。 示例
|