emule应用及原理

冰刀雪剑 2007-07-15

展开全文

来到vc也有很长时间了，从不再潜水到现在有一个月的时间了，在作为技术区版主的一个月期间，我认真留意了好多朋友提出的问题，发现不仅是我们刚接触emule的朋友，就算是一些玩了几个月的朋友，对于一些emule的问题也是模棱两可，存在不少误解之处，另外也确实有好多问题，本区和技术区的贴子从来没有对此进行过说明，再此，我就结合这些问题集中写一些解释，试着回答一些，希望能够解决众多朋友的不明之处，当然有错的地方，也请您不吝指教。

1）P2P到底是什么？

Peer-to-peer的缩写，指的是点对点的意思，最早是在美国由 18岁的Shawn Fanning开发出一个叫Napster的软件时，引入得概念，它不仅仅是一种软件架构，也是一种社会模式的体现，网络上流行的P2P软件的架构手段主要有两种：集中式和分布式。
集中式：便是利用服务器作为媒介使各个分散的节点(用户)能互相联系，生成各种服务响应。
分布式：每个节点即做服务器又做客户端，这种方式非常灵活，一个孤立的节点只要连上另一个节点便可以进行传输。
Napster可以说是第一代p2p软件。后来由于Napster陷入诉讼危机（相关版权问题），便出现了Gnutella，它吸取了Napster的失败教训，将P2P的理念更推进一步：它不存在中枢目录服务器，用户只要安装了该软件，立即变成一台能够提供完整目录和文件服务的服务器，并会自动搜寻其它同类服务器，从而联成一台由无数PC组成的网络超级服务器。传统网络的Server和Client在它的面前被重新定义。Gnutella作为第二代p2p软件，他们可以说是最早的p2p技术。然后FastTrack (即Kazaa 的底层技术)迅速掘起取代其地位。成为p2p老大。

2）emule到底是什么？

随着二代技术的普及，又一个的问题诞生了，自私的人们在利用P2P软件的时候大多只愿“获取”，而不愿“共享”，P2P的发展遇到了意识的发展瓶颈。不过，一头“骡”很快改变了游戏规则，它就是后来鼎鼎大名的 eDonkey。这标志着第三代p2p技术的兴起，eDonkey采用了以“分散式杂凑表”(distributed hash tables )为诉求的Neonet技术，改变了P2P网络上的搜索方式，理论上可以更有效率的搜索更多的电脑，以及更容易找出少见的文件。这种技术已经使eDonkey基本快要追上了P2P服务龙头业界的另一个老大Kazaa了. eDonkey由Jed McCaleb在2000年创立。他最重要的是可以同时从许多人那里下载同一个文件，并且采用了“多源文件传输协议”(MFTP，the Multisource FileTransfer Protocol)。电骡的索引服务器并不集中在一起的，而是各人私有的，遍布全世界，每一个人都可以运行电骡服务器，同时共享的文件索引为被称为“ed2k-quicklink”的连接，文件前缀“ED2K://”。同时，在协议中，定义了一系列传输、压缩和打包的标准，甚至还定义了一套积分的标准，你上传的数据量越大，积分越高，下载的速度也越快。而且每个文件都有有md5-hash的超级链接标示，这使得该文件独一无二，并且在整个网络上都可以追踪得到。EDonkey可以通过检索分段从多个用户那里下载文件，最终将下载的文件片断拼成整个文件。而且，只要你得到了一个文件片断，系统就会把这个片断共享给大家，尽管通过选项的设置你可以对上传速度做一些控制，但你无法关闭它。

在eDonkey出现后，其改良品种eMule(电骡)也出现了。可以说emule是eDonkey的升级版，是eDonkey的一个Mod,就象osp就是quake3的mod一样,它的独到之处在于开源，它的基本原理和运作方式，也都是基于eDonkey, eMule基于eDonkey网络协议，因此能够直接登录eDonkey的各类服务器。eMule同时也提供了很多eDonkey所没有的功能，比如可以自动搜索网络中的服务器、保留搜索结果、与连接用户交换服务器地址和文件、优先下载便于预览的文件头尾部分等等，这些都使得eMule使用起来更加便利，也让它得到了电骡的美誉。

总之，他们继承了第二代P2P无中心、纯分布式系统的特点，但他们它不再是简单的点到点通信，而是更高效、更复杂的网络通信；再加上eDonkey和eMule引入的强制共享机制，在一定程度上避免了前几代P2P纯个人服务器管理带来的随意性和低效率。

3）emule的下载原理？

当你在搜索列表中选取了你要的文件并开始下载后，emule会记录下这个文件的大小，文件名以及另一个叫做hash的特殊值。会向所有添加的服务器发出请求，要求得到有相同hash值的文件。而服务器则返回持有这个文件的用户信息。这样我们的客户端就可以直接的和拥有那个文件的用户沟通，看看是不是可以从他那里下载所需的文件。它最棒的部分就在于：你不是只在一个用户那里下载文件，而是同时从许多个用户那里下载文件。如果另一个用户仅仅只有你要的文件的一个小小片断，他也会自动地把这个片断分享个大家，而你就可以从这个用户的机器上下载这个片断。当然你也是一样。只要你得到了一个文件片断，系统就会把这个片断共享给大家。在查找到下载源(其他客户端)后，下载就是客户端和客户端通过点对点(P2P)进行直接对话了。期间没有数据流通过服务器。

4）emule是如何工作的？

emule建立于多点文件传输协议之上。一个emule网络由服务器端和客户端两部分组成。服务器端是客户端连接的、为了搜索和查找可以下载用户的桥梁。服务器列表像电话本一样排列，客户通过浏览它而获取他需要的文件所有者的客户端信息。在download过程中，没有下载文件通过服务器端。

5）emule是如何搜索的？

每一个客户端连接到一个服务器作为他的主服务器。在连接时，由客户端告诉主服务器他share了那些文件，以及IP地址等其他信息。所以每一个服务器会记录所有登陆到他服务器上的以上信息。在本服务器搜索时，它会通过匹配记录的已知以上信息把查找结果反馈给搜索的客户端列表。当你使用扩展搜索(extend search)时，你的搜索请求和应答结果通过发送限制带宽的UDP包连接到客户端本身的服务器列表(server.met)对应的某一个ip地址的服务器。

6）emule是如何下载的？

当客户端选择了一个文件下载时，它首先收集一个拥有该文档的客户端的列表。它会先行查询主服务器所有登陆用户他们是否拥有该文件。然后再连接和查选其他服务器的登陆用户所拥有该文件的客户端列表。一旦它找到拥有该文件的其他客户端，它将请求每个客户端发送这个文件的不同片。直至最后文件由这个不同的片组装成一个完整的文件。在进行pause/resume的时候，我们选择的下载列表已经获取，它pause的仅仅是客户端和客户端之间的TCP连接然后恢复TCP连接。这个过程只有再resume时通过客户端向服务器端发送22个字节后即可。占用的仅仅是22个字节的网络流量。在pause是甚至不通过你登陆的服务器进行，也无须你登陆的主服务器进行任何干预和操作。所以说，它并未占用主服务什么资源，只是在你已经和主服务器连接的通道上发送22个字节而已。

7）emule有什么优点？

不需要服务器来存放共享文件，节省了服务器架设、海量硬盘、网络带宽。每个用户端节点都同时是文件下载者和提供者。实际上，在你正在下载但还没当完整个文件时，你已经可以把你已下载的部分共享给别人了！因为emule同时从很多文件提供者那里下载所需的文件最后再拼成整个文件的。加入的人越多，下载速度越快，资源越丰富。共享方便，每个人在自已的emule里指定一个share目录就可以把自己的文件共享给网络中的其它人了。不必再辛苦地上传到服务器上了。

以上就是关于emule的一些基础知识，希望大家看完之后，能对emule的原理，有一个本质的认识。
下面我再来说说一些很困扰，很迷惑人的问题。

1）id问题

朋友们最关心的就是这个问题，id是什么？id其实没有什么用，id就是在emule传输里面，作为地址作用的一个东西，起到寻址和定址作用，它直接和我们ip挂钩，是由emule根据我们的ip地址，通过算法得到的一组数字。所以adsl用户经常会说，为什么我的id变了？当然要变，因为你每次上网拨号所取得的ip地址都不相同，所以id当然也要随之变化，一句话；ip不变id就不变，ip变了id就变化。
关于高id和低id，目前好多朋友也存在一个误区，认为同一个ip地址，只能而且最多只能拥有一个高id，其实这是不对的。一个公网ip地址，可以同时取得2个以上的高id，这一点我要在这里强调一下，比如，adsl用户，如果你本身是高id，那么你可以同时打开第二个emule两个同时运行，但是彼此的emule端口一定不要相同，这样你会发现两个都是高id，同一个ip地址。同样对于端口映射，同一个ip地址，也可以同时取得两个以上高id，同样端口不要相同。
对于低id用户，还存在一个误区，那就是认为只要映射了，就能变成高id，这一点我要说明一下，什么叫高id，它是一个9位以上的id数字，它代表了你的ip地址是公网独立的ip，也就是说只有前提你能够拥有公网独立的ip地址，你才能获得高id，端口映射的原理是把你的内网地址和端口，通过地址转换投影到公网干线上，使你作为一个公网节点，从而变成高id。那么这里就存在一个网络拓扑的问题，有些低id用户，不是处在公网干线的一级子网内，而是子网的下一级子网，甚至下好几级子网，拓扑的结构是层层拓扑，那么这部分用户，无论如何也无法获得高id，因为你做了映射只不过是成了上一级子网的节点，但是仍然还是内网，只不过映射了一层，你上面还有好几层，所以要正确看待映射的问题。目前，国内除了电信和网通，有好多二级运营商玩的就是这个路子，他们或者层层拓扑，或者只保留部分公网ip地址，作为机动分配，这样你运气好一拨号能得到一个公网ip，你运气不好就是内网，没有办法。

3）kad问题

好多朋友对这个东西始终不太明白，我说一下，kad和我们目前的ed2k不一样，我们目前的ed2k要通过服务器进行中转，我们都要连到服务上才能进行传输，而kad则是无服务器工作模式，它的传输可以独立进行，完全不需要服务器参与，我们只需要打开kad就可以不再需要服务器了，所以说kad是属于试验阶段，应该说他的前景最为光明，应该是p2p的未来，所以建议朋友们多多打开，对于找源很有帮助，特别是对于低id而言，vkad就是vnn+kad的模式。

4）服务器问题

这个问题论坛已经说了很多了，我主要说一些大家容易误会的地方，好多朋友经常问到，怎么我的服务器少了，或者是消失了，或者开机提示列表文件丢失，这里大家要注意在emule>选项>服务器设置里面启用智能lowid检测这一项最好不要选启动自动更新服务器列表也不要选把连接到其它服务器时自动更新选上，这样你可以在服务器切换的时候，自动更新服务器列表而不用添加什么列表的url网址之类的东西，另外对于常用的服务器，最好把他的状态选择为静态服务器，这样他就不会消失了，其实我们服务器列表有300多个服务器，能够用上的就那么几个，大家可以把他们设置成高级，静态，另外还要说一点，选择服务器的时候选择ping值小的人数多的文件多的这个文件数什么意思，是连接到这个服务器的所有用户的共享文件总数，要注意服务器上没有任何文件，另外大家注意一下服务器列表里面，每个服务器还有：软性文件限制硬性文件限制，这个是什么意思？他代表了服务器接受你的共享文件任务列表文件的大小限制，如果你要是超过了这个限制，就会被服务器拒绝，举个例子，如果这个值显示的是1k，那么你的共享文件数最好少于1000个，目前来看大部分都是1k。

其实对于服务器端，有好多愿意研究的朋友，很感兴趣。其实他就是edonkey的服务器，二者目前列表都一样，所以大家想要自己架设em服务器，可以上edonkey网站，下载服务器端的程序，我看了一下这个程序不大，而且也很简单，有兴趣的朋友们可以自己分析一下。

5）web服务器问题

大家都看了在emule>服务器>我的信息最下面总是有一个web服务器的东西，这个是什么？我说一下通常情况下我们这个禁用是正常的，Web服务器的作用是提供了远程访问eMule的功能，我们可以先在emule端配置一些相关参数，然后可以实现远程利用ie来对emule进行控制，当然了需要我们emule端要有独立的访问地址，远程控制emule可以实现emule的大部分功能，但是不是全部功能，还是有一些限制。另外对于emule端的web设置，懂行的朋友还可以自己进行编程，很有交互性，一般来讲，我们什么时候能够用上它呢？比如我们在公司开了emule，但是还想下班后继续在家里操作公司的emule，那么我们就可以使用这个功能，如此还有许多场合和环境特别利于web功能的使用，但是要注意随之带来的有关网络安全性问题也很重要。对于这个功能的使用，要是详细写出来的话，要很长需要专门的一个主题说明，由于篇幅限制，我在这里先简单说一下，如果朋友们都比较感兴趣，我考虑单独写一个主题详细说明具体设置和用法。不再赘述。

6）emule日志问题

其实这个问题没什么好说的，日志就是记载了emule的运行记录，我要强调的是好多朋友不懂得利用它，其实大部分emule遇到问题的时候，我们如果仔细注意日志记录，都会自己找到问题原因所在，如果你不懂你可以把它复制下来，发到网上，希望各位朋友以后多多注意emule的日志记录，遇到问题，多半能都自己解决。

7）任务下载问题

对于这个问题，我想说得是大家要学会使用给任务分优先级来控制下载顺序，经常有许多朋友抱怨，为什么任务结束一个，开始下一个的时候是随机开始，怎么能实现自动控制？这里我们就可以手动设置任务列表里面任务的优先级，右键就可以看到，把不同任务的优先级设置成高中低这样emule在完成一个的时候自然按照优先级去选择下一个该是谁，而不会随机开始了，另外在选项里面也可以设置一下，新建任务为停止模式，或者自动开始下一个停止文件。

8）搜索问题

其实要是大家都学会了利用该功能，就会找到好多意想不到的东西，好多朋友平时很少用这个功能，其实p2p引以为自豪的就是他的搜索功能，建议大家以后多多自己搜索，搜索的时候要注意，每页都有200条的限制，所以要想看更多的可以点击旁边的“更多”，这样可以显示下一个200条，可不要以为就只有第一页的200条记录啊！对于搜索颜色问题我说明一下：
红色：代表你的任务列表里面已经有的文件或者你已经下载完成正在共享的文件
蓝色：普及程度较高源比较多的文件
黑色：你从来都没有下载过的文件

9）共享文件问题

这个我说明一个问题，emule 里面规定共享的单个文件，注意是“单个”文件不可以超过4g，如果超过了，则不可以进行hash，所以大家注意一下。

10）emule消息问题

经常有朋友会受到You Was Banned!!! Banreason: You use a Leecher Mod
或者Defcon Old Leecherdetection之类的消息，这是什么意思？
有些朋友以为是有人要聊天，发送过来的消息，其实误会了，这是自动发送的信息，它的意思是你用的版本是吸血的版本。你已经被ban。对于这个消息，大家可以不用理会，用emule消息过滤，把它过滤掉就可以了，为什么会如此呢？这个要是说起来也话长了，颇有点传奇色彩。我简单说说，部分mod版本呢，由于加分设置不同，逐渐分成不同的派别，这样逐渐形成了一些小圈子，后来搞出来一个所谓吸血的东西，只下载不上传，或是该版本群体上传远远小于下载，等等这里面有好多渊源，后来官方公开封禁了一些，再后来自然被封的不服，然后就是妖魔和反妖魔大家互相封禁，互相职责，后来斗争扩大化，导致其他版本也跟着遭殃，我们就是属于被误伤的，现在这种争斗仍然在继续，而且波及越来越广，这就是我对这个消息的原因的简单解释，好多内幕的东西，说起来挺多，不多说了。

11）代理问题

这里我要说明一点，好多朋友使用代理运行emule，比如一些公司内网的朋友，你们在寻找代理的时候，尽量使用sock5的代理，当然sock4和http也可以，但是要注意好多http代理本身不支持udp协议，所以导致了emule无法运行，大家要注意，选择支持udp协议的代理。而且多找几个，留作备用。

12）统计信息问题

这个问题，我要说两点
（1）上传：下载比例问题之前好多朋友对这个有很多误会，这里我要说明这个比例大于1说明你的贡献大于索取，等于1，说明你的贡献和索取一致。小于1，则说明了你是一个索取的人，对p2p的贡献为负。大家一定要注意谁比谁，哪个是分母，哪个是分子，那么这有什么用呢？要注意p2p是一个讲究奉献，讲究积分的东西，你的上传多，你的下载快，这个比例也说明了使用者素质问题，另外对于这个比例，我们也有一些奖惩措施，比如上传：下载大于2，也就是说明了你的上传量是下载量的2倍，这个时候你在排队的时候，就可以享受优先排队待遇，这个比值越大越好，不存在什么限制，越大说明你的上传量越多，说明你的积分越多，你的贡献越多，当然你排队的时间就越少。如果这个比值小于1，而且越来越小，那么同样你的速度也会越来越慢，这个你怨不了谁。
（2）速度大小的问题好多朋友往往只关注了那个最大速度，但是实际上那个数值没有什么意义，他只是一个曲线峰值，往往一闪即逝，或者最多持续几秒，我们要关注的是我们的平均速度，这个二元值包含了时间的因素，所以他才能说明我们emule的整体速度大小。

13）积分问题

积分不是你对所有人的积分，只是在你机器下载的人他们的EM对你的积分，比如你开放的带宽大，小A在你那里下的很舒服，你就在小A那里的分数高。同样，小A那里也有一群人在下他的资料其中也有你，由于你开放的带宽多小A在你那里下的多，你在小A那里的积分就高，你就比其他在小A那里下载东西的人有优先下载小A资料的权限（小A可以设置高、普通这些的，设置高的时候就只有积分高的人优先下了）。
自己是无法看自己的积分的，因为这个积分不是永恒的，只是暂时针对一个文件的。

14）好友通道问题

我说明一点，加为好友开通通道，起到的作用只是，可以缩短你的排队时间，使你的信用积分突然变大，此外没有任何作用，他和速度没有本质的联系。

15）tag问题

好多朋友到现在也不明白为什么要有个[chn]有个[VeryCD]，这个有什么用，其实这个名称是任意的，甚至重名都没有问题，因为p2p世界里面判断你的标志是userhash，而不是用户名，用户名你随便改，一天一个新名字也不会影响你的积分，tag的作用是为了让一些服务器判断，从而可以连接该服务器，有的服务器就是规定了如果你不加[*****]就是不让你连接，所以就加上他连接方便点，另外有的mod可以实现对有相关[****]进行加分，比如我们vc版本对有[chn]的朋友就有固定的加分设置，它可以使所有有这个[chn]的朋友积分比没有这个的人多，从而达到中国人优先下载优先上传的问题，当然了这个问题，现在在世界范围内，仍是一个争论的话题，到底是否应该加分，大家也是众说纷纭。其实，懂行的朋友可以自己设置加分，可以随心所欲给任何[*****]加分减分，也可以给任意userhash加分减分，以达到优先上传优先下载的目的，甚至可以达到任意ban人的目的。当然了，这个问题不合适公开讨论，有违背p2p的根本，这里点到为止。

16）对于如何隐藏emule头像的问题

对于一些在公司工作的朋友，这一直是一个困扰很久的问题，如何还能下载，还不让老板发现。这里我说两个解决方案
（1）使用第三方软件解决可以使用SysTrayX软件，这个软件，国内大型软件站都有下载，它是一个管理系统托盘的软件，非常简单，具体使用方法，大家一看就明白了，他可以做到隐藏emule头像的问题，
（2）使用系统服务解决我们知道在2000以上系统中都有srvany服务，借助这个服务，也可以实现隐藏头像不借助第三方软件同样server系统可以用终端服务来实现隐藏头像，另外还可以借助instsrv服务来实现隐藏头像，原理和前面一样，其实就是一个东西，这种方法原理，常见于一些黑客网站，其实有些木马软件，或者后台软件，就是用的这个方案。大家有兴趣可以上一些黑客网站研究研究。

17）关于emule和bt的相关问题

好多朋友都在使用bt的同时，也在使用emule，我这里说一点，对于bt文件，如果我们下到了一半，没有种了，或者非常慢，我们可以把它导入emule下载，用dmTorrent2Par和Jcd2Met或者 Edonkeydoctor或者MetFileRegenerator，都可以实现该功能，很简单，另外emule的文件同样也可以导入bt进行下载，二者可以相互转换。为什么要说这一点呢，是要提醒大家，其实有好多emule的辅助工具，都可以帮我们更好的使用emule，它不是孤立的，只不过国内兴起的比较晚，目前来看，只要edonkey能用的相关软件，emule都能使用。比如，关于重建met的edonkeydoctor软件，就可以使一些下载了很多的错误文件，直接进行修复而不是像以前那样把辛苦下到的删掉。是我们遇到问题需要关闭的时候，不用再担心要删除文件了。

林林总总。写了好多，但是发现其实关于每个问题说明，都还只是停留在蜻蜓点水的层面，由于篇幅所限，不能深入写下去，如果要是写多了，朋友们多没有耐心看，所以对于每个问题，我就先写这么多，如果大家对于其中的某个问题，特别有兴趣，我考虑可以逐个展开，以独立主题的方式，详细介绍，这里先写这么多，可能这样，也不一定有朋友能都看完。总之，这是我作为版主一个多月来，对于大家集中问题的一个搜集和解答，希望会对大家有所帮助，同样，我们论坛里面藏龙卧虎，我深知还有不少朋友也都很有心得，潜于当中，我的水平有限，好多问题考虑的也不周到，这里肯定还有不少错误的地方，请大家指出，我本身也是一个外行，希望各位能够不吝赐教，我深感荣幸！在这里先行感谢了！

Ps:文中部分资料来源于网上，恕不列出转引出处，请原作者见谅！

★贰℡叁★

2004-12-3, 20:56 PM

第三篇：到底什么是hash？

从emule诞生到现在也已经有了两年左右时间了，随着emule的普及，喜欢他的人也越来越多，但是由于emule对技术相应有一个门槛，不像bt那么容易上手，所以很多朋友很长时间以来一直都有这样或那样的疑问，今天是周末我也献献丑，写一篇关于hash的文章。

大家天天都在使用emule，hash这个词是在emule里面出现频率最高的，那么到底什么是hash呢？

让我们先来了解一些基本知识，作作预热只有这样才能更好的了解hash。

Hash，一般翻译做“散列”，也有直接音译为"哈希"的，就是把任意长度的输入（又叫做预映射， pre-image），通过散列算法，变换成固定长度的输出，该输出就是散列值。这种转换是一种压缩映射，也就是，散列值的空间通常远小于输入的空间，不同的输入可能会散列成相同的输出，而不可能从散列值来唯一的确定输入值。

简单的说就是一种将任意长度的消息压缩到某一固定长度的消息摘要的函数。

HASH主要用于信息安全领域中加密算法，他把一些不同长度的信息转化成杂乱的128位的编码里,叫做HASH值. 也可以说，hash就是找到一种数据内容和数据存放地址之间的映射关系

了解了hash基本定义，就不能不提到一些著名的hash算法，MD5 和 SHA1 可以说是目前应用最广泛的Hash算法，而它们都是以 MD4 为基础设计的。那么他们都是什么意思呢？
这里简单说一下：

1) MD4
MD4(RFC 1320)是 MIT 的 Ronald L. Rivest 在 1990 年设计的，MD 是 Message Digest 的缩写。它适用在32位字长的处理器上用高速软件实现--它是基于 32 位操作数的位操作来实现的。

2) MD5
MD5(RFC 1321)是 Rivest 于1991年对MD4的改进版本。它对输入仍以512位分组，其输出是4个32位字的级联，与 MD4 相同。MD5比MD4来得复杂，并且速度较之要慢一点，但更安全，在抗分析和抗差分方面表现更好

3) SHA1 及其他
SHA1是由NIST NSA设计为同DSA一起使用的，它对长度小于264的输入，产生长度为160bit的散列值，因此抗穷举(brute-force)性更好。SHA-1 设计时基于和MD4相同原理,并且模仿了该算法。

那么这些Hash算法到底有什么用呢？
Hash算法在信息安全方面的应用主要体现在以下的3个方面：

1) 文件校验
我们比较熟悉的校验算法有奇偶校验和CRC校验，这2种校验并没有抗数据篡改的能力，它们一定程度上能检测并纠正数据传输中的信道误码，但却不能防止对数据的恶意破坏。
MD5 Hash算法的"数字指纹"特性，使它成为目前应用最广泛的一种文件完整性校验和(Checksum)算法，不少Unix系统有提供计算md5 checksum的命令。
2) 数字签名
Hash 算法也是现代密码体系中的一个重要组成部分。由于非对称算法的运算速度较慢，所以在数字签名协议中，单向散列函数扮演了一个重要的角色。对 Hash 值，又称"数字摘要"进行数字签名，在统计上可以认为与对文件本身进行数字签名是等效的。而且这样的协议还有其他的优点。
3) 鉴权协议
如下的鉴权协议又被称作"挑战--认证模式：在传输信道是可被侦听，但不可被篡改的情况下，这是一种简单而安全的方法。

以上就是一些关于hash以及其相关的一些基本预备知识。那么在emule里面他具体起到什么作用呢？

什么是文件的hash值呢？

大家都知道emule是基于P2P （Peer-to-peer的缩写，指的是点对点的意思的软件），它采用了“多源文件传输协议”(MFTP，the Multisource FileTransfer Protocol)。在协议中，定义了一系列传输、压缩和打包还有积分的标准，emule 对于每个文件都有md5-hash的算法设置，这使得该文件独一无二，并且在整个网络上都可以追踪得到。

MD5-Hash-文件的数字文摘通过Hash函数计算得到。不管文件长度如何，它的Hash函数计算结果是一个固定长度的数字。与加密算法不同，这一个Hash算法是一个不可逆的单向函数。采用安全性高的Hash算法，如MD5、SHA时，两个不同的文件几乎不可能得到相同的Hash结果。因此，一旦文件被修改，就可检测出来。

当我们的文件放到emule里面进行共享发布的时候，emule会根据hash算法自动生成这个文件的hash值，他就是这个文件唯一的身份标志，它包含了这个文件的基本信息,然后把它提交到所连接的服务器。当有他人想对这个文件提出下载请求的时候，这个hash值可以让他人知道他正在下载的文件是不是就是他所想要的。尤其是在文件的其他属性被更改之后（如名称等）这个值就更显得重要。而且服务器还提供了,这个文件当前所在的用户的地址,端口等信息,这样emule就知道到哪里去下载了.

一般来讲我们要搜索一个文件，emule在得到了这个信息后，会向被添加的服务器发出请求，要求得到有相同hash值的文件。而服务器则返回持有这个文件的用户信息。这样我们的客户端就可以直接的和拥有那个文件的用户沟通，看看是不是可以从他那里下载所需的文件。

对于emule中文件的hash值是固定的，也是唯一的，它就相当于这个文件的信息摘要，无论这个文件在谁的机器上，他的hash值都是不变的，无论过了多长时间，这个值始终如一，当我们在进行文件的下载上传过程中，emule都是通过这个值来确定文件。

那么什么是userhash呢？

道理同上，当我们在第一次使用emule的时候，emule会自动生成一个值，这个值也是唯一的，它是我们在emule世界里面的标志，只要你不卸载，不删除config，你的userhash值也就永远不变，积分制度就是通过这个值在起作用，emule里面的积分保存，身份识别，都是使用这个值，而和你的id和你的用户名无关，你随便怎么改这些东西，你的userhash值都是不变的，这也充分保证了公平性。其实他也是一个信息摘要，只不过保存的不是文件信息，而是我们每个人的信息。

那么什么是hash文件呢？

我们经常在emule日至里面看到，emule正在hash文件，这里就是利用了hash算法的文件校验性这个功能了，文章前面已经说了一些这些功能，其实这部分是一个非常复杂的过程，目前在ftp,bt等软件里面都是用的这个基本原理，emule里面是采用文件分块传输，这样传输的每一块都要进行对比校验，如果错误则要进行重新下载，这期间这些相关信息写入met文件，直到整个任务完成，这个时候part文件进行重新命名，然后使用move命令，把它传送到incoming文件里面，然后met文件自动删除，所以我们有的时候会遇到hash文件失败，就是指的是met里面的信息出了错误不能够和part文件匹配，另外有的时候开机也要疯狂hash，有两种情况一种是你在第一次使用，这个时候要hash提取所有文件信息，还有一种情况就是上一次你非法关机，那么这个时候就是要进行排错校验了。

关于hash的算法研究，一直是信息科学里面的一个前沿，尤其在网络技术普及的今天，他的重要性越来越突出，其实我们每天在网上进行的信息交流安全验证，我们在使用的操作系统密钥原理，里面都有它的身影，特别对于那些研究信息安全有兴趣的朋友，这更是一个打开信息世界的钥匙，他在hack世界里面也是一个研究的焦点.我是一个门外汉，利用这个周末找了一些资料，胡乱写了一点关于hash的文章，也有不少是我自己的分析，这期间肯定还有不对的地方，还请朋友们多多指出错误，我抛砖引玉希望大家批评指导。

Ps:文章中部分资料来源于网上,这里就不一一列举出处了,如有冒犯,请原作者原谅.由于本文写的有些乱七八糟,希望大家看完后,多多提出毛病,我也好修改修改.写的不好让大家见笑了!

★贰℡叁★

2004-12-3, 21:01 PM

第四篇：如何配置emule的web服务器功能！

关于emule里面web服务器的配置，我今天详细介绍一下，希望朋友们在看本篇之前，先看一下我的这一篇文章
[注意]关于emule一些让人糊涂问题的总结！地址如下http://bbs.VeryCD.com/forum/t/114499.shtml
里面有对web服务器功能的简要介绍，希望朋友们先了解一下，关于web的特征和具体作用，在这里我就不多说了。

但是先声明一下，这个功能一般对于希望远程控制emule的朋友适用，对于一般的用户，可以不用打开，希望朋友们要注意一下。另外，对于一些对该功能感兴趣的朋友，也可以体验一下该功能。

在介绍web功能之前，让我们先来看看他的界面，如下：

user posted image

我们都知道，emule中的Web服务器给我们提供了，可以远程控制eMule的功能途径，借由此我们可以实现通过ie浏览器，异地操作emule，达到如服务器般的使用效果。下面介绍一下，上图功能面板中的，各项参数的具体含义：

(1)模板
它提供了Web工作界面所需要的一个现成的模版 eMule.tmpl .模版功能就如同office里面的一样,提供了一些格式和素材，我们可以直接套用编辑。而不需要自己单独设计,eMule.tmpl 模版包含了,现成的配置Web 界面的布局及设计. 我们可以看一下我们的emule安装文件路径里面有没有这个文件，如果没有的话，那么我们需要到http://www./ 也就是emule的官方网站去下载该文件模版，（目前有的mod直接提供了该文件）。另外，对于web控制界面的编辑，emule提供了一种交互的功能，就是我们可以自己编辑该控制界面，所以对于有兴趣的朋友不妨自己试试，对于我们编辑需要的用到图片资源，我们可以把他放在 eMule安装文件夹里面的 Webserver 文件夹內。下图是用官方版本繁体版本做好后web控制界面的效果：

user posted image

怎么样不错吧！web远程界面功能提供了eMule 几乎全部的功能. 我们通过对他的所有操作，都将会直接在我们远程控制的电脑上的eMule做出相应相应执行.

常规部分介绍：

(2)启用
该选项用来启用 Web 界面. 我们在前面点选,打上对号就代表已经启用了web功能,然后我们把emule重新启动一下,该功能就生效了,并会打开一个Web 界面. 如果我们发现系统提示无效的 eMule.tmpl 错误讯息,例如:无法载入模版无法打开文件 \...\eMule.tmpl之类的提示.那么就说明我们目前还不能启用Web界面功能,我们就要仔细检查一下我们网络连接和配置了.

(3)Gzip 压缩
该功能用来实现压缩web界面所使用的宽带.使我们的带宽得到更为有效的应用.

(4)端口
这里设置Web 界面所要使用的端口. Emule默认设置是4711口,我们通常不需要改变它,但要注意设置完该端口后,也要在防火墙相应把该端口打开. Emule 通过这个端口来进行web功能操作. 我们也可以自己改成我们合适的端口,随便，没有什么特殊要求.总之,安全即可!我们要注意，如果电脑处于内网或是防火墙内，我们需要设置端口转发。

(5)模板
前面已经说过了,通常情况下模版文件 *.tmpl 是在 eMule 的安裝文件夹里面.通过这里面设置,我们可以改变该文件的安装路径.

(6)管理员
我们可以自己设定一个执行Web 界面功能的密码.通过这个密码,可以保证我们对emule 远程操作功能的唯一特权,以防止别人在远程操作emule,甚至改变我们的emule设置,所以这个密码也很重要,启到作用就如同我们登陆系统时，需要输入密码作用一样,可以防止别人使用.密码会显示成6个*****.emule不存在预设密码,这个自己设定!

客人部分介绍

(7) 启用
可以设定不同于管理員权限的用户,来操作eMule 的远程控制,客人只能查看emule设定值和任务列表等. 他沒有权力更改任何设置. 如果我们自己使用,不需要客人登陆,那么这个选项可以停用.

(8)密码
可以设定一个客人密码来限制客人的存取界面. 同样也没有预设密码.自己设定.

注意:
在我们使用 Microsofts Internet Explorer 更换 Web 界面选择清单的时候,有的时候总是会弹出一个下载的窗口.那么怎么办呢? 我们可以这样做来阻止这个窗口弹出:
在 ie的工具选项->高级->选中使用HTTP 1.1和通过代理连接使用HTTP 1.1

(9)MobileMule
MubileMule功能提供了,可以由任何支持java的手机来移动远程控制emule的功能,和ie远程控制一样,只不过换到了手机上.对于这个功能的详细使用,大家可以更多登陆 MobileMule的网页 http://mobil./.来详细查看.

(10)启用 MobileMule
该功能允许支持java功能的手机控制eMule.

(11)密码
同样，可以设定手机登陆控制的密码.也没有初始设定，自己设定。

(12)端口
可以设定 MobileMule的工作端口.对于端口，我们要注意，如果电脑处于内网或是防火墙内，我们需要设置端口转发。

我们在设定Web 服务器的时候，首先先要在emule运行端，也就是我们所要远程控制端，拥有一个确定的ip访问地址或者域名，只有通过这个地址，我们才能在ie中输入该地址，才能达到远程打开web控制界面，远程操作emule的目的。
只有通过该地址和端口，我们才能远程操作，我们远程操作的时候，需要在ie浏览器内，输入该地址和端口，这个地址和一般的网页地址一样，比如：我们操作的时候输入http://.:端口，x 表示要访问的IP 位址，而端口默认的话就是4711

那么，我们的isp要是改变了我们要访问的远程ip地址怎么办？或者我目前不知道我要访问的远程ip地址怎么办？
对于有以上问题的朋友，我们可以选择上一些网站，注册一个静态主机域名，现在国内有好多网站都提供免费注册域名的服务，这样我们就可以通过在ie里面直接输入我们注册的主机域名来远程访问emule，不用害怕ip地址不知道了。

总之，web端的配置非常简单，而且有效，尤其是我们目前有些朋友在公司工作，而且公司又要求晚上可以不用关机，那么我们可以在公司电脑上，白天运行emule，晚上下班后在家里面的电脑上，依然可以远程控制emule的下载和长传，这样第二天去上班，就会发现我们已经下载了好多电影，反正公司的电脑开着也是开着，反正不用也是浪费，那么何乐而不为呢？
即可以给自己挣积分，也可以多下东西，多好！另外，对于一些7*24小时不关机的朋友，如果你出门了不在电脑前面，又害怕别人乱动emule，使用这个功能也是一个不错的选择啊，可以随时查看我们的小骡工作情况，随时与它交流，多好！

最后：使用该功能的朋友要注意一点，就是密码一定要设置好，而且端口一定要管理好，这一点尤为重要，以防出现网络安全问题。不过，通常是不会有什么关系了，不过还是小心为妙！如果我们配置好了密码，我们登陆的时候就会出现这个界面：

user posted image

好了，以上这些就是web服务器配置的详细说明，里面有什么错误，也请大家给与指出，文章大部分来自官方的说明解释
我看英文说明，我的英文不太好，翻译的也不好，文中有什么错误，请大家指出，谢谢！文中图片也是官方网站上所载。

小王

2004-12-27, 23:16 PM

第四篇：到底什么是kad？

关于kad网络，这一个多月来我发现有好多刚刚接触emule的朋友不太明白，总是搞不清楚这是个什么东西，虽然本区以前也曾经有人写过一些关于kad 的文章，但是可能新来的朋友不会去翻了，那么我就结合自己对kad的一点认识，来重新谈一下kad吧？其中有好多不对的地方也请诸位朋友不要笑话我，请一一指出在。小王这里多谢了！

Kad是Kademlia的简称，eMule的官方网站在2004年2月27日正式发布的 eMule v0.42b中，Kad开始正式内嵌成为eMule的一个功能模块，可以说从这个版本开始eMule便开始支持Kad网络了。

Kad的出现，结束了之前edonkey时代，在ed圈里只存在着ED2K一种网络的模式，它通过新的协议开创并形成了自己的kad网络，使之和ED2K网络并驾齐驱，而且它还完全支持两种网络，可以在两种网络之间通用。Kad同样也属于开源的自由软件。它的程序和源代码可以在官方网站http://www.上下载。

Kad网络拓扑的最大特点在于它完全不需要服务器，我们都知道传统的ed2k网络需要服务器支持作为中转和存储hash列表信息，kad可以不通过服务器同样完成ed2k网络的一切功能，你唯一要做的就是连线上网，然后打开kad。Kad需要UDP端口的支持，之后Emule会自动按照客户端的要求，来判断它能否自由连线，然后同样也会分配给你一个id，这个过程和我们ed2k的高id和低id检查很像，不过这个id所代表的意义不同于ed2k网络，它代表一个是否“freely”的状态。

Kad和ed2k网络有着完全不同的观念但是相同的目的: 都是搜索和寻找文件的源。 Kad网络的主要的目标是做到不需要服务器和改善可量测性。相对于传统的ed2k服务器只能处理一定数量的使用者(我们在服务器列表也都看到了,每个服务器都有最大人数限制)，而且如果服务器比较大连接人数过多,还会严重的的拖垮网络。而Kad能够自我组织,并且自我调节最佳的使用者数量以及他们的连接效果。因此, 它更能使网络的损失达到最小。由于具备了以上所叙述的功能，Kad也被称之为Serverless network（无服务器网络）。虽然目前一直处于开发阶段(alpha stage) 。但毫无疑问，它无可比拟的优势,将会使它成为p2p的明天。

可能很多朋友会关注， kad网络没有高低id的计算原则，是否对于低id来言就畅通无阻了呢？

我们大家知道在ed2k网络里面，我们的id是通过ip进行如下的算法计算得出的
设我们的IP = A.B.C.D
那么我们的ID number= A + 256*B + 256*256*C + 256*256*256*D
low ID的产生是由于我们的ID计算结果小于16777216.
即 ID number= A + 256*B + 256*256*C + 256*256*256*D < 16777216

Kad的 id计算原则并不是象上面那样，他更关注我们是否open和freely。
但是kad里面是如何计算我们的id呢？
事实上它的计算方法是这样
ID number=256*256*256*A+256*256*B+256*C+D
所以kad其实也有高低id的分别。所以内网用户在使用的时候依旧无法达到内网用户完全穿透网络的效果，而且目前来看，还存在着kad模块引入,导致占用系统资源会变大以及会突然产生Memory Leak的问题，对于内存的控制，目前emule做的效果还是不好。

其实kad本身有一个nodes.dat文件，也叫做节点文件，这里面存放了我们在Kad网络中的邻居节点，我们都是通过这些节点来进入Kad网络的。其实kad的网络倒更像是overnet和Kazaa网络，有兴趣的朋友大家可以对比看看。Kad网络提供了帮助寻找节点以及记录节点的机制。

下面我们来说说这个机制的原理：
Kad拥有一个160bit的ID，每一个节点送出的讯息都必须包含此ID。每一个节点都必须记录一个资料来保存已经存在的节点，资料的格式是 (IP address, UDP port, Node ID)，节点所必须负责的范围是2的i次方及2的i+1次方，i的范围是0 < i <160，这个结构叫做k-bucket，该结构会形成一个tree的形状，每一次接收到新的信息时，各个节点都必须更新k-bucket內的资料，透过k-bucket结构我们可以保证所有的节点状态都是新的，而且一定会知道这个节点在哪里。

Kademlia网络提供四种Potocol(RPC)
(1)PING 测试是否节点存在
(2)STORE存储通知的资料
(3)FIND_NODE 通知其他节点帮助寻找node
(4)FIND_VALUE 通知其他节点帮助寻找Value
而当每一个指令被接受到后，每一个节点都会到k-bucket上搜寻，通过这样的结构，kad提供一个方便快速且可以被保证在logN次数下找到所需的节点。

通俗的来讲就是在kad网络中，我们每个emule用户端只负责处理一小部分搜索和查找源的工作。分配这些工作的时候，通过我们每个用户端的唯一的ID和搜索文件的hash值之间的匹配来决定。比如像我猜我猜我猜猜.rm这个文件由用户小王来负责（通过该文件的hash值来决定），那么任何其他用户在下载这个文件的時候都会告诉其他用户,小王有这个文件，其他用户去下载这个文件的時候也会询问小王，小王也会告诉他们谁正在共享这个文件，这样kad找源的工作就完成了。搜索时候的方法也差不多，只不过是每个人负责一个关键字。

整个过程有点像在照线索循序问路而找到正确方向，而不是路上随便到处抓人在问路。而每个地方里的网络相关信息，则会随着电脑及文件的加入而持续更新。好处在于让你可以搜索整个网络，而不只是在某一地区。目前来讲，这个机制和算法是绝对领先而且非常优秀的。

如何找到用户小王则是通过将用户id异或的方式，两个id的二进位异或值决定他们之间的逻辑距离，如1100距离1101要比距离1001近。那么当一个用户加入kad后，首先通过一个已知的用户找到一批用户的id和ip地址和端口。当该用户要寻找一个特定用户A的时候，该用户先询问几个已知的逻辑距离较A较近的用户，如B用户,C用户,D用户，B，C，D会告诉该用户他们知道的更加近的用户的id和ip地址和端口，同理类推，这个用户最终就能找到A。所以寻找的次数会在logN数量级，这里N代表询问的人数。

其实也就是一种分散式杂凑的方法，基本上是对网络上某一特定时刻的文件进行快照(snapshot)，然后将这些信息分散到整个网络里。为了找到特定的文件，搜索的要求先到达网络上的任何一台电脑上，然后这台电脑就会再将它转到另一台有更多文件信息的电脑。第三台电脑可能就拥有文件本身──或者也可能再继续转到其他有正确信息的电脑。采用这种方法，通常只需要跳转两到三次，便可以轻松查找到所需文件。

以上几个部分，便是对于kad作用原理以及算法的分析，可能好多人看了之后头大，那么我们普通用户到底该注意些什么呢？

很简单，你要作的就是再使用emule的时候打开kad，你会发现有两个明显的特点
(1)你的下载速度会加快
(2)你的下载文件的源会增加
以上两条对于lowid和经常下载源在国外的文件用户，效果就更为突出，特别对于在ed2k网络中只有几个源或者没有源的文件，在kad网络中，一般都能找到源，所以说你使用了emule下载文件，基本上不会出现没有源的请况，无论多长时间，差别只是源的多少个数问题，由于kad网络都是自动配置的，所以你丝毫不用分心，那么索性我们就打开它，何乐而不为呢？

另外对于我们搜索的时候，如果采用kad网络搜索,多数情况下找到的文件源会远远多于ed2k的全局搜索，对于大家都是一个明智的选择。

虽然，目前kad还处在试验阶段，但是他的崛起是迟早的事情，我从kad一开始推出就一直在使用，开始的时候用的人不多，效果不明显。但是目前来讲，再我发帖前，我还做过测试现在kad的使用人数已经突飞猛进，我随便找了一期我猜我猜我猜猜来做测试，发现kad找到源的比例已经占了总源比例的30%，甚至更多，时间越长效果越明显。所以，在这里呼吁大家都打开kad，让我们的速度再迈上一个台阶.早日迎接kad天下的到来!

Ps:文中部分技术资料,来自于国外的网站,原文是英文的,我翻译过来,然后引用,由于本人英文水平有限,出现的错误请大家多多包涵！
另外,文中也引述参考了一些国内外网站关于kad技术的文章,但是所引太杂,所以请恕这里不引出原文出处,请愿作者见谅！