【原】pyaudio：基于pyaudio利用Python编程从电脑端录制音频保存到指定文件夹+将录音上传服务器+录音进行识别并转为文本保存

处女座的程序猿 2021-09-28

展开全文

pyaudio：基于pyaudio利用Python编程从电脑端录制音频保存到指定文件夹+将录音上传服务器+录音进行识别并转为文本保存

输出结果

代码实现

# -*- coding: utf-8 -*-

#pyaudio：利用pyaudio从电脑端录制音频保存到指定文件夹+将录音上传服务器+录音进行识别并转为文本保存
import wave
from pyaudio import PyAudio,paInt16

import urllib  #urllib2
import pycurl
import urllib.request as urllib2
import json 

framerate=8000   #采样率
NUM_SAMPLES=2000 #采样点
channels=1  #一个声道
sampwidth=2 #两个字节十六位
TIME=2      #条件变量，可以设置定义录音的时间

def save_wave_file(filename, data):   #save the date to the wav file
    wf = wave.open(filename, 'wb')  #二进制写入模式
    wf.setnchannels(channels)  
    wf.setsampwidth(sampwidth)  #两个字节16位
    wf.setframerate(framerate)  #帧速率
    wf.writeframes(b"".join(data))  #把数据加进去，就会存到硬盘上去wf.writeframes(b"".join(data)) 
    wf.close()

def my_record():
    pa=PyAudio()
    stream=pa.open(format=paInt16,channels=1,rate=framerate,input=True,frames_per_buffer=NUM_SAMPLES)
    my_buf=[]
    count=0  #
    while count < TIME*8: #循环2*20次
        string_audio_data=stream.read(NUM_SAMPLES) #每读完2000个采样加1
        my_buf.append(string_audio_data)
        count+=1
        print('当前正在录音(同时录制系统内部和麦克风的声音)……')
    save_wave_file('03.wav',my_buf) #文件保存
    stream.close()
    
def dump_res(buf):  #dump_res即dump_result,buf是curl从网上返回来的缓存
    print(buf)
    
    my_temp=json.loads(buf)
    my_list=my_temp['result']
    print(type(my_list))
    print(my_list[0])  #输出第一个
    print('dump_res函数调用成功！')
    
def get_token():  #获取token
    apikey='2KeNr6nK6ZmMKAbdlM5PUaSC'
    secretkey='QuDTqg1cMehfwvvyKmZyifAnCoGFiZ3g'
    auth_url='https://openapi.baidu.com/oauth/2.0/token?grant_type=client_credentials&client_id='+apikey+'&client_secret='+secretkey;   #
    
    res=urllib2.urlopen(auth_url) #获取服务器响应,res=urllib2.urlopen(auth_url) 
    json_data=res.read()         #读取到json_data中
    print(json_data,type(json_data))
    return json.loads(json_data)['access_token']

def use_cloud(token):  #token类似一种访问权限等
    fp=wave.open(u'16k.wav','rb')             #打开wav文件
    nf=fp.getnframes()                     #获得文件的采样点数量
    print('sampwidth',fp.getsampwidth())
    print('framerate',fp.getframerate())
    print('channels',fp.getnchannels())
    f_len=nf*2                    #获取文件长度,文件长度计算，每个采样点2个字节
    audio_data=fp.readframes(nf)  #
    
    cuid="XXXXXXXXXX"   #硬件地址，my phone xiaomi MAC
    print(token)
    srv_url='http://vop.baidu.com/server_api'+'?cuid='+cuid+'&token='+token
    http_header=[
        'Content-Type:audio/pcm;rate=8000',  #音频,原先是pcm,可以改为wav
        'Content-length:%d:' % f_len
    ]
    
    c=pycurl.Curl()  #实例化curl
    c.setopt(pycurl.URL,str(srv_url))     #(网址)  
    
    c.setopt(c.HTTPHEADER, http_header)   #网址头部  
    c.setopt(c.POST, 1)                   #1表示调用post方法而不是get  
    c.setopt(c.CONNECTTIMEOUT,80)      #超时中断  
    c.setopt(c.TIMEOUT,80)             #下载超时  
    c.setopt(c.WRITEFUNCTION,dump_res) #返回数据，dump_res,进行回调  
    c.setopt(c.POSTFIELDS,audio_data)    #数据  
    c.setopt(c.POSTFIELDSIZE,f_len)      #文件大小
    c.perform()                           #提交， pycurl.perform()
    print('use_cloud函数over！')

if __name__ == "__main__": 
#     my_record()
    print('录音结束！')
    token = get_token() 
    use_cloud(token)
    print('over！')

相关文章
ASR：基于pyaudio利用python进行语音生成、语音识别总结及其案例详细攻略