pyAudioAnalysis-用于音频特征提取，分类，分段和应用的python库

CNStudent 2020-12-08

展开全文

pyAudioAnalysis是一个开放的Python库，提供了许多与音频相关的功能，着重于特征提取，分类，分段和可视化问题。

功能

pyAudioAnalysis是一个Python库，涵盖了广泛的音频分析任务。

通过pyAudioAnalysis您可以：

提取音频特征和表示形式（例如，mfccs, spectrogram, chromagram）
训练，参数调整和评估音频片段的分类器
分类未知声音
检测音频事件并从长时间录音中排除静音期
执行监督性细分（联合细分-分类）
执行无监督的分段（例如，说话者二值化）并提取音频缩略图
训练和使用音频回归模型（示例应用程序：情感识别）
应用降维以可视化音频数据和内容相似性

实用功能

将Mp3批量转换为Wav

函数使用提供的采样率（第二个参数）和通道数（第三个参数）convertDirMP3ToWav(dirName, Fs, nC, useMp3TagsAsName = False) 将文件夹的所有MP3文件转换dirName为WAV文件。如果将最后一个参数（useMp3TagsAsName）设置为True，则输出的WAV文件将通过MP3标签（歌手和歌曲名）命名，否则将使用MP3文件名（当然，扩展名为.wav）

命令行使用示例

python audioAnalysis.py dirMp3toWav -i MusicData/ -r 16000 -c 1

另外，convertFsDirWavToWav()可以使用函数将存储在特定文件夹中的WAV列表转换为另一个采样率的相同信号的新列表（再次是WAV文件）。交流示例：

python audioAnalysis.py dirWavResample -i MusicData/ -r 8000 -c 1

新文件存储在名为Fs_Nc的新文件夹下，例如Fs8000_NC1

pyAudioAnalysis - Theodoros Giannakopoulos

下载安装

下载文件包： pyAudioAnalysis模块下载

安装依赖：pip install -r ./requirements.txt

使用pip安装： pip install -e

音频分类示例

pyAudioAnalysis提供了易于调用的包装器来执行音频分析任务。例如，给定存储在文件夹（每个文件夹代表一个不同的类别）中的一组WAV文件，此代码首先训练一个音频片段分类器，然后使用经过训练的分类器对未知的音频WAV文件进行分类：

from pyAudioAnalysis import audioTrainTest as aTaT.extract_features_and_train(["classifierData/music","classifierData/speech"], 1.0, 1.0, aT.shortTermWindow, aT.shortTermStep, "svm", "svmSMtemp", False)aT.file_classification("data/doremi.wav", "svmSMtemp","svm")

本站是提供个人知识管理的网络存储空间，所有内容均由用户发布，不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息，谨防诈骗。如发现有害或侵权内容，请点击一键举报。

转藏分享

QQ空间 QQ好友新浪微博微信

献花（0） +1

来自： CNStudent > 《python库》

举报/认领

0条评论

发表

请遵守用户评论公约

类似文章 更多