分享

平均不等式最好的证明方法是什么?

 宣城华厦图书馆 2017-12-21

要说平均不等式,先说说基本的算术平均和几何平均的概念:

算术平均是n个数加起来除以n。

几何平均是n个正数乘起来开n次方。

平均不等式是说:n个正数的几何平均数总不大于它们的算术平均数; 反过来说算术平均总不小于几何平均。

这是个很有趣的结论,应用也比较广泛。在n=2,也即有两个数的时候,可以画一个图来解释:

直角三角形ABC斜边上的高在斜边上的垂足E把斜边分成了两条线段BE, CE。那条高AE是这两条线段BE, CE的比例中项,也就刚好是两线段的几何平均;而斜边的一半也就是斜边上的中线AD是这两条线段的算术平均。那么可以看到,斜边上的高AE是不可能大于斜边上的中线AD的,至多相等。

(AE是BE和CE的几何平均,AD是算术平均,AE≤AD)

平均值不等式有时也称为柯西不等式。柯西是法国数学家,在他的著作里给出了证明方法,先用根式的方法证明了n是2的正整数数幂时成立,然后推导出一般情形下n>=2时成立。

后来人们又用了很多种方法证明了平均不等式,其中比较快捷的方法是对n=2时成立的基础上(上面说的图),运用数学归纳法来证明。

然而答者在这里介绍一种更为快捷的证明方法,简单得不可思议,而且背后隐藏着数学的众多秘密!我们先建立一定的基础:

首先,几何平均涉及到相乘和开方,利用对数运算它可以等价为n个数的对数的算术平均再反取相应的指数运算的值。这里对数运算可以直接用自然对数g(x)=ln(x),然后相应的指数函数(反函数)是e^(x)。于是我们把g暂时称为几何平均的“相关函数”(函数有时也称为映射),也就是g代表了几何平均。

同样的思想,从算术平均也可以”提炼”出一个相关函数h(x)=x(x>0)。想想看是不是?算术平均是不是相应的n个数的h运算结果的算术平均值,然后反过来取h的反函数后的值?因为h运算和它的反运算都就是等于算数的本身嘛!上面的基础很简单,另外一个重要的基础是2007年答者新发表的一条很有趣的定理(代称:定理L),说:

对于上面的g和h,如果g,h,h’/g’(导数比值)3个函数都单调,且有奇数个函数(1个或3个)是单调增时,那么g代表的平均(Mg)小于等于h代表的平均(Mh);反之有奇数个函数是单调减时,Mg大于等于Mh!

好了,证明开始:g(x)=lnx和h(x)=x都是单调增的,h’/g’=x’/(lnx)’=1/(1/x)=x也是单调增的,有3个单调增了!于是根据定理得到:几何平均不大于算术平均。证明结束!

是不是简单得不可思议??所以说这就是目前最好的平均不等式的证明方法!

那么问题来了,上面的定理L怎么来的?和平均不等式的本质有和联系?

先看看平均不等式和上面的定理L还有什么潜力可挖。

首先,算术平均(AM),几何平均(GM),还有未曾提到的调和平均(HM)在几千年前就被毕达哥拉斯和追随者研究了。只要让上面的g(x)=1/x(x>0)就得到调和平均HM。三者统称为毕达哥拉斯平均,满足 HM≤GM≤AM。另外,把上面的g(x)换成幂不为0的幂函数x^a(a不为0),则得到一个幂平均族。而且可以证明,幂平均在a趋向于0的极限情况下,值等于几何平均,所以几何平均也可广义上被归到幂平均(lnx的导数是1/x,比0次低一次,类似于幂函数的导数低一次,也暗合了这一点)。属于幂平均的常见平均还有平方平均(a=2)。再广义一点,把g扩展为任何单调连续有反函数的函数,则得到“类算术平均值”(quasi-arithmetic mean)或“广义f平均”(generalised f-mean, Mf),f就这里的g或h。

幂平均(带上几何平均,幂a=0),有很多共性:

(1)保值性:相等的n个数的幂平均还是这个数

(2)单调性:任一数递增,则平均值递增;反之亦然。

(3)平均性:平均值总介于最小和最大值之间。

(4)齐次性:所有n数同时倍乘k>0后所得的平均,是原平均的k倍。

(5)其它。

而广义f平均满足前三点;除幂平均特例外,不满足齐次性。

幂平均,满足对于任何a

再例如g(x)=1/x(x>0)代表HM,h(x)=lnx(x>0)代表GM: 则h’/g’=(1/x)/(-x^2) = -x单调减,g单调减,h单调增,总共有1个函数单调增,故HM≤GM。把g, h对调,则得到奇数个单调减,运用定理后半部分,结果也等价!幂平均定理的一般情况,留给感兴趣的读者去做证明。非常简单!

定理L发表在《高等数学研究》2007年7月第10卷第4期85页,作为论文《论双变量同构凸函数》里的定理2推论1出现。

(该图第二行四个连等处,中间那个等号排版错误,应去除)

在该论文所论述的《双变量同构凸函数》理论中,由任意两单调函数g, h的排列,形成一种所谓的(g,h)双变量同构凸性,任何定义域相符合的非常数函数f在(g,h)的影响下可能整体或局部呈现为“同构凸”或“同构凹”,由一个不等式的方向来表征。当g,h都为y=x时,则“同构凸性”就是数学分析上的凸性,是一个最简特例!

因为(g,h)的出现,导致和凸性有一个敏锐的区别是:当g, h不同时,(g, h)对于f(x)=x的同构凸性是有呈现的!而f(x)=x在普通数学分析中是一条直线没有凸性呈现!

(g,h)对于f(x)=x的同构凸性的呈现是什么?就是定理L!!而且这种呈现有总共2^3=8种不同的可能情形!(因g,h,h’/g’各有2种变化),四种为凸,四种为凹。于是用《双变量同构凸函数》的理论来解释平均不等式的本质,它就是g,h两种相关映射对于直线f(x)=x的双变量同构凸性的呈现!

试着把g,h同时换成映射y=x,则g,h,h’/g’三个函数中有偶数个单调增,剩下一个不单增也不单减,法则失去意义,为什么?因为上面说的f(x)=x在普通数学分析中没有凸性呈现,这时对应的是“AM=AM”。那么当g,h同时换成映射lnx时,法则也无意义,对应的是“GM=GM”。

而当f(x)不为f(x)=x,也不为常数时,则h’/g’要退回另一种复杂点的形式h’(f)/g’,定理L也退回“(g,h)双变量同构凸性”的微分判定定理,也有8种情形;尤其当g,h同时为y=x时,h’(f)/g’为f的导数f’,我们熟悉的通过导数增减判别曲线凹凸的方法(微分判定定理)出来了!它就是“(g,h)双变量同构凸性”的微分判定定理2”的子形式,也就是定理L的“表姊妹”形式!

这些只有通过在一个比普通数学分析高一层次的理论角度,才能被察觉和论述!关注答者头条号了解这个理论 -《同构数学分析》!。 在其中,答者还建立了特殊的坐标系来用几何方法解释上述的一切。其中g和h作为x,y两个坐标轴的映射,其轴上的密度不同导致两个坐标各处对f(x)=x的“拉力”不同,于是f(x)=x呈现为曲线,你可以直观的看到HM≤GM≤AM!而且该理论也能解释为什么上面说可以用定理L来比较的平均值是比较“纯正”的平均值,没毛病。

另外,从形式上说定理L是詹森不等式的推论,平均不等式、广义f平均的比较不等式都可以通过詹森不等式本身来进行推导,只不过步骤复杂很多,暗中包括了定理L的母定理的推导过程。(数学不都是这样吗,比如:你通过勾股定理证明了一个定理,但你也可以不知道勾股定理,只把它的证明过程包含进来;同样后面人可以进一步借用你的定理,省略勾股定理)不过,定理L和它的母定理以比较高层、简单、对称、针对的凝练形式体现出来了。这也是为什么借用这个定理的证法被答者称为当前最好的证法的原因。

最后答者给一个有趣的提示。定理L的三个因素:g,h,h’/g’的单调性有8种可能变化,它和逻辑代数中的三值亦或运算(xor)是相通的。假定已知初始态A XOR B XOR C = 1,则A,B,C三个运算数中有任意一个数倒反(1到0,或0到1),则计算结果倒反,继续相同操作也如此。也有8种变化,而定理L的8种变化也刚好有这种倒反性!

和这个倒反性吻合的还有立体坐标系中的8个卦限,每相邻两个卦限有两个公用半轴方向相同,另一对半轴方向相反!

和这个倒反性吻合的还有传统文化中的八卦,三横阳爻为乾为阳,每倒反一爻,阴阳倒反!

关于最后一点,它不是数学的研究范畴,数学也不依赖于它,权当巧合!

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多