计算机科学论坛--利用DirectSound实现声卡录音

weicat 2007-05-31

展开全文

利用DirectSound实现声卡录音

摘要：本文详细讲述了如何利用DirectSound对经过声卡和麦克风的数据进行捕获，进行录音，并保存为wave格式的文件。

　　曾经学习过Directshow的开发，对于Dsound一直没有仔细的学习，以前只是知道Dsound是做音频开发的，我一直以为它和Dshow的结构体系差不多，经过仔细学习后，发现，其实他们完全两码事。DirectSound虽然也基于COM，但不象Dshow那样多个的filter组成链表。
闲话少说，下面我们看看DirectSound到底能帮我们做些什么。

　　1、播放WAVE格式的音频文件或者资源。

　　2、可以同时播放多个音频。

　　3、Assign high-priority sounds to hardware-controlled buffers

　　4、播放3D立体声音

　　5、在声音中添加特技效果，比如回声，动态的改变特技的参数等

　　6、将麦克风或者其他音频输入设备的声音录制成wave格式的文件

　　DirectSound就能做这么多事情，到这里，我都有点怀疑DirectSound是不是就是封装了mmio系列和wav系列的函数。因为这些底层的API也能够完成这些事情。这里我们主要讨论一下，如果使用Directsound进行录音，并保存成wave格式的文件。

　　在开始工作之前，要先介绍DirectSound录音用到的三个非常重要的对象：

　　·IDirectSoundCapture8 ，设备对象，根据你录音的设备创建的设备对象，利用该对象可以获取设备的属性。

　　·IDirectSoundCaptureBuffer8，缓冲区对象，该对象由设备对象创建，主要用来操作音频数据

　　·IDirectSoundNotify8 ，事件通知对象，该对象用来通知应用程序从缓冲区中将数据取走，写入文件保存起来。

　　利用DirectSound录音的主要思路，就是先根据选择的录音设备创建设备对象，然后通过设备对象创建辅助缓冲区对象，开始录音的时候，设备将数据写入缓冲区，应用程序主动的从缓冲区将数据读出来写文件即可，就实现了录音功能。这里简单介绍一下dsound的通知功能，应用程序会创建一个通知对象，然后将通知对象邦定，然后设定通知位置（position），什么是通知位置呢，比如缓冲区的大小为4000字节，如果你想当数据达到缓冲区一半的时候能得到通知开始copy数据，那么此时你就可以将通知位置设定为2000，通知位置可以任意的设定，当缓冲区的数据达到你设定的位置时，就会通知应用程序将缓冲区的数据copy到文件中，缓冲区是循环利用的，当缓冲区填充满了以后，就会从头开始充填数据，所以，缓冲区就是一边读，一边写的过程。

　　下面我讲一下录音的主要步骤，可以使大家的思路更清晰一些

　　1、枚举录音的设备

　　2、根据选择的设备创建设备对象

　　3、利用设备对象创建缓冲区对象

　　4、设置通知机制

　　5、创建工作线程，用来将缓冲区的数据写入文件。

　　先来定义一下用到的数据

LPDIRECTSOUNDCAPTURE8 g_pDSCapture = NULL;//设备对象指针
LPDIRECTSOUNDCAPTUREBUFFER g_pDSBCapture = NULL;//缓冲区对象指针
LPDIRECTSOUNDNOTIFY8 g_pDSNotify = NULL;//用来设置通知的对象接口

GUID g_guidCaptureDevice = GUID_NULL; //设备id
BOOL g_bRecording = FALSE; //是否正在录音
WAVEFORMATEX g_wfxInput; //输入的音频格式

DSBPOSITIONNOTIFY g_aPosNotify[ NUM_REC_NOTIFICATIONS + 1 ]; //设置通知标志的数组
HANDLE g_hNotificationEvent; //通知事件
BOOL g_abInputFormatSupported[20];
DWORD g_dwCaptureBufferSize; //录音用缓冲区的大小
DWORD g_dwNextCaptureOffset;//偏移位置
DWORD g_dwNotifySize;// 通知位置
CWaveFile* g_pWaveFile;//

　　枚举录音的设备

　　如果你的程序只是想从用户缺省的设备上进行声音的录制，那么就没有必要来枚举出系统中的所有录音的设备，当你调用DirectSoundCaptureCreate8 或者另外一个函数DirectSoundFullDuplexCreate8的时候，其实就默认指定了一个缺省的录音设备。

　　当然，在下面的情况下，你就必须要枚举系统中所有的设备，例如，你的应用程序并不支持所有的输出设备，或者你的应用程需要两个或者多个设备，或者你希望用户自己来选择输出设备。

　　枚举设备，你首先要定义一个回调函数，这个回调函数可以被系统中的每个设备来调用，你可以在各函数做任何事情，这个函数的命名也没有任何的限制，但是函数应该以DSEnumCallback为原型，如果枚举没有结束，这个回调函数就返回TRUE，如果枚举结束，例如你找到合适的设备，这个函数就要返回FALSE。

　　下面是回调函数的一个例子，这个函数将枚举的每一个设备都添加到一个combox中，将设备的GUID保存到一个item 中，这个函数的前三个参数由设备的驱动程序提供，第四个参数有DirectSoundCaptureEnumerate函数提供，这个参数可以是任意的32位值，这个例子里是combox的句柄，

BOOL CALLBACK DSEnumProc(LPGUID lpGUID,
LPCTSTR lpszDesc,
LPCTSTR lpszDrvName,
LPVOID lpContext )
{
HWND hCombo = (HWND)lpContext;
LPGUID lpTemp = NULL;

if (lpGUID != NULL) // NULL only for "Primary Sound Driver".
{
if ((lpTemp = (LPGUID)malloc(sizeof(GUID))) == NULL)
{
return(TRUE);
}
memcpy(lpTemp, lpGUID, sizeof(GUID));
}
//下面的代码主要主要是将设备添加到CComboBox，其实你完全直接将CComboBox指针传递过来，直接的添加，这里采用的是给combox窗口发送消息的方法，
ComboBox_AddString(hCombo, lpszDesc);
ComboBox_SetItemData(hCombo,
ComboBox_FindString(hCombo, 0, lpszDesc),
lpTemp );
free(lpTemp);
return(TRUE);
}

　　枚举设备通常都是在对话框初始化的时候才进行的，我们假设hCombo就是combox句柄，hDlg就对话框的句柄，看看我们怎么来枚举设备的吧。

if (FAILED(DirectSoundCaptureEnumerate ((LPDSENUMCALLBACK)DSEnumProc,
(VOID*)&hCombo)))
{
EndDialog(hDlg, TRUE);
return(TRUE);
}

　　在这个例子中，combox的句柄作为参数传递到DirectSoundEnumerate函数中，然后又被传递到回调函数中，这个参数你可以是你想传递的任意的32位值。

　　注：第一个被枚举的设备通常称为Primary sound driver，并且回调函数的lpGUID为NULL，这个设备就是用户通过控制面板设置的缺省的录音声音设备，

	广告

2007-5-31 16:01:31

本主题贴数3，分页： [1]

管理选项：修改tag | 锁定 | 解锁 | 提升 | 删除 | 移动 | 固顶 | 总固顶 | 奖励 | 惩罚 | 发布公告


	W 3 C h i n a ( 2 0 0 3 - 2 0 0 7 ) 旗下站点苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》本站域名、主机由万维中华(www.wwwchina.cn)免费提供, FTP由www.eawan.com免费提供!	234.375ms