1是1/3

思明居士 2023-02-02 发布于河北

展开全文

早在1881年的时候，一个名为纽康的天文学家就发现，在一组数据之中，不同数字出现在首位的概率是不相同的，而在将近60年之后，另一个名为“本福特”的物理学家也发现了相同的规律，所以这一规律就被称之为“本福特定律”。

根据本福特定律，1作为首位数字出现的概率是最高的，大约达到了30%。真的是这样吗？你可以亲自选取一些数据来进行验证，比如某一年世界各国的GDP数据、世界上所有国家的国土面积数据，又或者你可以数一数我最近发表的50篇文章的评论数数据，你会惊奇地发现首位为1的出现概率真的是接近30%的。那么这到底是为什么呢？除了1以外，2、3、4、5、6在首位出现的概率也可以计算出来吗？当然是可以的。

本福特定律是有一个计算公式的，即为P(N)=lg((N+1)/N)，这里的P(N)就代表了数字N在首位出现的概率。

我们首先将1代入这个公式，就得到了P(1)=lg2=30.1%，所以1在首位出现的概率就是30.1%。再将2代入公式，就得到了P(2)=lg3/2=17.6%，所以2在首位出现的概率就是17.6%。将3代入公式，就得到P(3)=lg4/3=12.5%，所以3在首位出现的概率就是12.5%。

后面的数字就不一一计算了，直接给出结果：4的概率是9.7%、5的概率是7.9%、6的概率是6.7%、7的概率是5.8%、8的概率是5.1%、9的概率是4.6%。从最后的结果可知，越大的数字出现在首位的概率就越小。有了这个规律，当我们拿到一组数据的时候，就可以根据这组数据首位数字的分布规律来对这组数据的真假有一个基本的判断。

比如某个投资顾问在向你极力推荐他们的投资产品，并拿出了过往10年的月度收益数据时，你就可以通过本福特定律来对这组数据的真假有一个初步的判断，如果数据明显违背本福特定律，那么你有必要通过其它的方式来对这个数据做进一步的核实。

本福特定律可以应用于任何地方吗？当然不。本福特定律的应用要满足两个基本条件，第一必须是非人为规律的数据，比如一个班级的期末考试成绩数据就不行，因为分数是人为规定的，我们人为地将100分设定为满分，自然就不能满足本福特定律，否则如果一个班中30%的人都考了10多分，可就麻烦了。第二是数据的跨度必须要大。比如我文章的评论数，很多文章只有2、3个评论，也有些文章有三五十个评论，还有一些有数百评论，数据跨度非常大，这就可以应用本福特定律。如果是一个学校各个班级的人数数据就不行，因为跨度太小，每个班都是四五十人，当然不行了。

那么为什么会出现本福特定律呢？不同数字出现在首位的概率为什么会不一样呢？

首先我们要确认一点，那就是本福特定律迄今为止并不是一个公认的定律，也并没有一个公认的证明，所以你可以去反驳它，也可以去寻找它背后的内在原理，但是不同数字出现在首位的概率不一样，这是一件很正常的事。

举个例子来说吧，10如果想要变为20，那么需要增长100%，而90要想变为100，只需要增长10%，而在一组数据之中，增长相同百分比所需的时间是相同的，首位9变成1，要比1变成2容易得多，所以1的出现概率自然比2大。当然，这只是对本福特定律的一种探讨，并不是公认的证明。欢迎大家从不同的角度来说一说你所理解的本福特定律。