python录制视频和声音

xvdo 2021-11-12

展开全文

音频预处理

这一讲主要介绍些音频基本处理方式，为接下来的语音识别打基础。

三种播放音频的方式

使用 python 播放音频有以下几种方式：

os.system()

os.system(file) 调用系统应用来打开文件，file 可为图片或者音频文件。

缺点：要打开具体的应用，不能在后台播放音频。

pyaudio

安装：pip install pyaudio

官方提供了播放音频与录音的 api ，使用十分方便，只要把Filename更改为你的音频文件的文字，就可以播放音频了。

'''PyAudio Example: Play a WAVE file.'''

import pyaudio

import wave

CHUNK = 1024

FILENAME = '你的音频文件'

def play(filename = FILENAME):

wf = wave.open(filename, 'rb')

p = pyaudio.PyAudio()

stream = p.open(format=p.get_format_from_width(wf.getsampwidth()),

channels=wf.getnchannels(),

rate=wf.getframerate(),

output=True)

data = wf.readframes(CHUNK)

while data != b'':

stream.write(data)

data = wf.readframes(CHUNK)

stream.stop_stream()

stream.close()

p.terminate()

jupyter notebook

在 jupyer notebook 中播放音频可以使用以下函数：

import IPython.display as ipd

ipd.Audio(文件名)

几种读取音频的方式

python 有很多读取音频文件的方法，内置的库 wave ，科学计算库 scipy, 和方便易用的语音处理库 librosa。

下面将介绍分别使用这几种库读取音频文件：

安装：

wave 是内置库直接导入即可。

scipy: pip install scipy

librosa: pip install librosa

使用：

wave.open:

参数 path 为文件名，mode 为打开方式

以'rb'方式打开文件返回一个 Wave_read 对象，而以'wb'方式打开文件返回一个 Wave_write 对象。

scipy.io.wavfile:

参数 path 为文件名

返回 rate : 采样率（每秒采样点的个数），data : 音频数据

librosa.load:

参数 path 为文件名

返回 y 为音频数据，sr 为采样率

# read wav file from path

from scipy.io import wavfile

import librosa

import pyaudio

# wave

file = wave.open(path,'rb')

# wavfile

rate, data = wavfile.read(path)

# librosa

y, sr = librosa.load(path)

下面演示一个使用 wavfile 读取音频文件并且画出波形的例子：

首先要计算音频到底持续了多长时间，wave 的 shape 就是总的采样点个数，除以采样频率可以得到持续的总时间（秒），乘1000得到总持续时间（毫秒）。接着通过 np.linsapce 产生时间的序列，最后使用 matplotlib 画出图像。

from scipy.io import wavfile

import matplotlib.pyplot as plt

import numpy as np

%matplotlib inline

# 一秒采样数

sr, wave = wavfile.read('D://QQPCMgr/Desktop/python3/skip.wav')

sample_number = wave.shape[0]

total_time = int(sample_number / sr * 1000)

time_series = np.linspace(0,total_time,sample_number)

fig, ax = plt.subplots(1, 1)

ax.plot(time_series, wave)

ax.set_title('Time*Amplitude')

ax.set_xlabel('Time/ms')

ax.set_ylabel('Amplitude/dB')

20181230113611861.png?20181130113635

最后再借用 pyaudio 的 api 我们可以实现连续录音功能：

python 实现录音功能

其中，函数 multi_record每结束一次录音会询问 “是否进行下一次录音？”，按回车就可以进行下一次录音了。

import wave

import pyaudio

import matplotlib.pyplot as plt

import time

CHUNK = 1024

FORMAT = pyaudio.paInt16

CHANNELS = 2

RATE = 44100

RECORD_SECONDS = 5

def record(filename='output.wav'):

'''官方录音教程

'''

p = pyaudio.PyAudio()

stream = p.open(format=FORMAT,

channels=CHANNELS,

rate=RATE,

input=True,

frames_per_buffer=CHUNK)

print('* recording')

frames = []

for i in range(0, int(RATE / CHUNK * RECORD_SECONDS)):

data = stream.read(CHUNK)

frames.append(data)

print('* done recording')

stream.stop_stream()

stream.close()

p.terminate()

wf = wave.open(filename, 'wb')

wf.setnchannels(CHANNELS)

wf.setsampwidth(p.get_sample_size(FORMAT))

wf.setframerate(RATE)

wf.writeframes(b''.join(frames))

wf.close()

def multi_record(num=3):

'''implement 多次录音'''

for i in range(1,num+1):

print('第{}次录音准备'.format(i))

filename = 'record_{}.wav'.format(i)

record(filename)

time.sleep(second)

_ = input('进行下一次录音？')

def main():

multi_record()

if __name__ == '__main__':

main()

总结

以上就是这篇文章的全部内容了，希望本文的内容对大家的学习或者工作具有一定的参考学习价值，如果有疑问大家可以留言交流，谢谢大家对脚本之家的支持。

本站是提供个人知识管理的网络存储空间，所有内容均由用户发布，不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息，谨防诈骗。如发现有害或侵权内容，请点击一键举报。

转藏分享

QQ空间 QQ好友新浪微博微信

献花（0） +1

来自： xvdo > 《python编程学习》

举报/认领

0条评论

发表

请遵守用户评论公约

类似文章 更多

xvdo

关注对话

TA的最新馆藏

python录制视频和声音
利用Python进行录音和音频分析
在网页中实现录音功能
通过python实现网页录音的效果
树莓派学习手记——使用Python录音
python写一个录音小程序

喜欢该文的人也喜欢更多

热门阅读换一换