还记得DOS时代有一个程序被大家奉为后台操作的经典,那就是Print.EXE(由M$提供),这个程序用于后台打印。可以从一定程度上实现了多任务,但是DOS并不是一个多任务的环境所以勉强实现多任务时限制太多。随后有了Windows 3.X,虽然OS有了多任务的支持但是严格的说来对多进程的支持并不够,这主要表现在进程间通信方面提供的支持非常少。一些传统的IPC方式都没有提供。后来在WinNT上完全实现了多进程/多线程支持,当然现在的Windows9X/2K都完全提供了这方面的支持。
什么是进程(Process):普通的解释就是,进程是程序的一次执行,而什么是线程(Thread),线程可以理解为进程中的执行的一段程序片段。在一个多任务环境中下面的概念可以帮助我们理解两者间的差别:
- 进程间是独立的,这表现在内存空间,上下文环境;线程运行在进程空间内。
- 一般来讲(不使用特殊技术)进程是无法突破进程边界存取其他进程内的存储空间;而线程由于处于进程空间内,所以同一进程所产生的线程共享同一内存空间。(图一)
- 同一进程中的两段代码不能够同时执行,除非引入线程。
- 线程是属于进程的,当进程退出时该进程所产生的线程都会被强制退出并清除。
- 线程占用的资源要少于进程所占用的资源。
- 进程和线程都可以有优先级。
- 在线程系统中进程也是一个线程。可以将进程理解为一个程序的第一个线程。
 图一
一个最简单的例子就是在屏幕上画多个跳动的小球,我们对每个球的绘制都可以采用一个线程来完成。但是象这样的线程间完全独立没有影响没有数据交换的情况是很少的。
下面我们看一个例子,一个应用要完成两个任务:每次产生1000个随机数写入文件并从文件中读出数据并以该随机数为圆心画圆,对该操做进行100次,并使用100个不同的文件保存文件。传统做法如下: void do_this(void)
{
for(int i=0;i<100;i++)
{
/// step 1
generate 1000 randam number;
write to file;
/// step 2
read from file;
draw circle;
}
}
如果引入多进程的概念,则实现方法可以改为: void do_this(void)
{
CreateProcess("do_rand.exe",...);
CreateProcess("draw_circle.exe",...);
}
//do_rand.exe
void do_rand(void)
{
for(int i=0;i<100;i++)
{
/// step 1
generate 1000 randam number;
write to file;
wait draw_circle finish last task
tell draw_cricle data ready
}
}
//draw_circle.exe
void draw_circle(void)
{
for(int i=0;i<100;i++)
{
/// step 2
set flag of last task finish
wait data ready
read from file;
draw circle;
}
}
在多进程中我们引入了更多的控制手段,首先do_rand在准备好数据后必须等待draw_circle处于空闲状态,这样做的原因是只有一个进程在进行画圆操作,所以必须保证当前提交的data ready请求能够被接收。在图二中我们可以看到用红框内的代码会在同时执行,由于使用了不同的文件所以不需要对文件的使用情况也进行判断。
 图二
如果使用线程,我们可以进一步的改造程序,我们取消使用文件来保存数据,而是全局变量来保存数据: void do_this(void)
{
CreateThread("do_rand",...);//参数为线程入口而不是执行程序
CreateThread("draw_circle",...);
}
global int giRandNum[1000];
void do_rand(void)
{
for(int i=0;i<100;i++)
{
/// step 1
local int iRandNum[1000];
generate 1000 randam number;
get access of giRandNum;
memcpy(giRandNum,iRandNum,...);
release access of giRandNum;
wait draw_circle finish last task
tell draw_cricle data ready
}
}
void draw_circle(void)
{
for(int i=0;i<100;i++)
{
/// step 2
set flag of last task finish
wait data ready
local int iRandNum[1000];
get access of giRandNum;
memcpy(iRandNum,giRandNum,...);
release access of giRandNum;
draw circle;
}
}
在这里我们使用全局变量来保存数据,而且程序使用的资源要小于前面使用进程的情况,而且效率是相同的。在这里我们由引入了对全局数据使用情况的判断,这是因为保证全局数据在被draw_circle读取的时候不会被do_rand修改。这就是一个数据同步的概念,实现数据同步的方法在4.4 进程/线程间同步会详细讲解。
通过上面的例子可以看出使用多线程时可以提高效率又能够节省资源。
最后一点线程在单CPU主机上与多进程相比是没有的效率上的提高,而在多CPU的主机上不同的线程代码可以分配到不同的主机上执行。但多进程/线程与单进程相比的在效率和速度上的优点很很明显的。
随着多线进程/程序的采用同时也会产生很多其他的问题,比如数据如何交换(在上面的例子中我们使用文件来保存中间数据,当然还有很多的方法来在进程间交换数据),数据如何同步(保证某些数据在同时只被一段代码进行写操作),如何协调进程/线程间的操作(一个进程的继续执行是否要等待其他进程完成某些操作)。 |