分享

如何通晓当代人类全部科学文明?

 昵称21405352 2023-07-15 发布于湖南

很多网友希望能专门对通晓能力进行一下介绍。这对第三代科学是非常重要的一个课题,本文就来整理相关的内容。

一、通晓当代人类全部科学文明的必要性和意义

在古代的智者中,可以见到不少通晓当时全部人类知识的智者。但无论是欧美、中国还是其他国家的学者,普遍认为在今天知识信息爆炸的时代已经不可能做到这一点了。也有很多人可能会认为具备这种能力没有意义,无论是搞学术研究还是做实际工作,需要的是专业,只有在专业的狭窄领域精益求精,才能有效地出成果。这样的分科与专业当然是永远需要的,但人类也同样永远需要通晓自己所处时代全部的文明成就,否则一定会出现各类不同的问题。

1. 全科型专业领域的天然需要

有很多学科领域表面看起来是一个专业,事实上对研究者的知识结构会有全科型的需要。以经济学研究为例,它就是一个需要全科型的知识结构为基础才能进行研究的。经济活动包含了需求、生产、交易三个方面。无论是马克思的社会主义经济学还是微观经济学、宏观经济学等各个学派,都认为需求是无法直接去精确研究的。马克思的经济学将商品分为使用价值和价值两个属性,而后将使用价值抽象掉,只研究商品的价值。但马克思因为最重视劳动,所以对生产过程有非常详尽的直接观察和研究。在《资本论》一书中用了两章的篇幅来专门讨论手工业和机器大生产的技术细节。在微观经济学中对需求和生产两个方面基本上都是做了最大程度的简化,将一切经济研究全都变成对各种数学模型的研究。以效用、偏好、预期、边际收益等不同数学模型去替代对人类需求本身的直接测量和分析。生产过程涉及近乎人类当代所有不同学科的科技知识,基本上被经济学家视为畏途。虽然也有人提出应当直接分析所有生产过程,但绝大多数经济学家都认为这是不可能做到的事情。因此仅用一些抽象的生产函数来替代对生产本身技术细节的直接测量与研究。

这导致的结果是什么?经济学就变成一种打着经济学各种名词旗号的“异类数学”,是一群数学水平和能力不足以达到直接在数学领域获得任何成就,所以就把数学概念打上经济学概念标签来形成自己的职业领地,从而搞出一种异类数学。数学领域的学者们搞不懂他们在研究些什么东西,而真正经济领域的人也搞不懂他们在研究些什么东西。通过这种“异类数学”,不仅可以为一批人找碗饭吃,一不小心还能蒙上个“瑞典中央银行纪念阿尔弗雷德·诺贝尔经济科学奖”。至少在今天,整个西方学术界根本就没有一个具备经济学最基本研究能力的人,那些研究的东西必然都是不合格品,居然还能发出那么多诺贝尔经济学奖。其确切的名称应当叫“瑞典中央银行纪念阿尔弗雷德·诺贝尔异类数学奖”。客观地说,因为金融等某些领域,其涉及的需求与生产知识较少,从而纯粹的异类数学产生的问题还没那么大。这也是异类数学可以在这些领域发挥相对积极作用的原因所在。

事实上,经济学领域有很多学者是意识到这一点的,只是另外一些学者认为要做到这一点难度太大,没有实际可能性。所以经济学研究的要点就是必须学会进行简化。但全科型知识结构就是经济学研究的必要基础,在缺少全科型知识结构支持前提下的简化,很容易导致出现实质性的偏差。

因此,如果不具备通晓能力,就不可能有正常的经济科学。象经济学这类必须建立在全科型知识结构基础上的学科还有很多。如果不具备通晓能力,这些领域的研究虽然不说绝对没有一点意义,但必然是充满荒谬和错误的。这样的领域还有:

科学学。这门学科本身就是要研究整个科学的,如果不具备通晓能力,不能理解所有当代人类科学知识,怎么可能完善地研究科学本身呢?

历史学。人类的历史最重要组成部分就是整个人类科技知识,如果不具备通晓能力,历史研究显然是会存在欠缺的。

数字化。数字化是整个社会一切生产领域和社会领域的数字化,如果不具备通晓能力,如何保证对数字化有完整准确的理解?以我参与撰写的华为《大交通时代》一书为例。这还仅仅是谈交通行业数字化的书,但其涉及的专业领域已经是跨越数以百计:高速公路、高铁、航空、地铁、城市交通、桥梁、隧道、机场、高铁站、地铁站、高速公路服务区、智能交通监控、港口、船舶、航运、5G、云计算、大数据、传感器、导航、人工智能、物联网、数据库、身份识别、定票系统、支付、数字货币、财务、安全......这还仅仅是大类的专业领域,往下第二级的细分会有数量级的增长,要再细分到第三层就更多了。这些不同专业领域不仅形成各自不同的“信息烟囱”,而且各种说法都不一样,甚至对这个问题本身的描述都不同,有的叫“信息孤岛”。各个细分领域的专家都很多,可是,要能够把所有这些技术和社会领域的专业知识全都串起来,就必须要具备通晓的能力才可以做到。在这本书的撰写过程中,我是唯一可以顺利地穿通所有专业领域,并可以在通晓能力基础上做出判断的专家。参见:汪涛,华为《大交通时代》。

图片

图片

图片

该书最后部分由我写的评价

因此,即使一些并不一定要通晓当代全人类知识的领域,也需要接近于准通晓的能力,它还是需要通晓的方法和能力。

科技政策。政策的制定是要影响整个科技领域的,如果不具备通晓能力,如何保证制定的政策对整个科技领域的影响是正面的?但我们所有科技政策就是对科学一知半解的人制定的。我们所说的“一知半解”,并不是说他们就是外行,而是很可能制定科技政策的人,或者参与制定科技政策的资深科学顾问,都只能是各个狭窄专业领域的专家,他们不能通晓整个人类的科技知识,这样的专业建议肯定都是有专业局限带来的偏差的。

如果有人就是故意要利用制定政策机会给自己创造寻租的条件,即使拥有院士、博导等头衔的真正资深专家们,也可能说不出反对的理由是什么。不是他们不想说,不敢说,而是真的看不清也说不清。因为只有在全科型知识结构支撑下,才能对科技政策有最客观准确的理解和判断。

2. 应对战略忽悠和避免“残缺性学术”的需要

可以说,战略忽悠的基本原理,就是利用某些需要跨越很多专业学科领域才能准确理解的问题,通过故意去掉其中某些必要专业知识而形成的错误论调。因为经济学本身就是需要全科型知识结构才能有效研究的学科,所以整个西方的经济学最大用途就是用作战略忽悠。任何科学研究本身也都必然是要进行一定的抽象和简化的,这就使战略忽悠与科学的真正简化之间很难进行有效的区别。但真正出于科学的研究目的而进行的简化,是不能改变最基本的研究对象基本逻辑框架和结构,经济学的研究必需要具备全科型的知识结构,原因是其研究对象本身就需要全科型的知识结构。只是在遇到具体问题时,可能还是主要涉及部分的专业范围,可以针对具体问题进行有效的简化,但不能对整个经济学的学科进行非全科型的简化。例如,当我们要谈石油的经济问题时,不仅要对整个石油的生产环节技术知识有系统的了解,而且要理解与其相关的一切能源技术的竞争性影响,上下游技术进步情况等。

我曾在“中美关系——轻舟已过万重山(下)”一文中提到过一个美国“航母海上棺材论”的战略忽悠。这个忽悠的基本论点是非常正确的,问题只是作为其前提条件的弹道导弹打航母的技术在苏联时代无法实现。如果前提不能成立,论点本身无论多么正确都没有任何实际意义,都只能是战略忽悠。而前提条件是否成立,就必然涉及到非常不同的技术领域。因此,战略欺骗的高手们从来不关注任何论点,关注的都是论点成立的前提条件是什么。

我们再以当前社会上反对中国当年人口政策的一些论点来说明。只要有饭吃,人口当然是越多越好嘛,这个是清楚明了的,无可争议的论点和真理。但问题就在于其基本的前提:人如果多到没饭吃怎么办?由于当前中国生育率持续下降,这类论点似乎越来越受社会大众欢迎。有没有饭吃不是人口统计学问题、也不是消费能力和劳动力数量问题,而只是粮食专业问题。粮食可不仅仅是农学(主要研究种子),而且涉及到地理、水资源、气候、土壤、能源、设施农业、化肥、其他农业相关物资生产、国际粮食市场、国际粮食战略、人口发展史、饥荒与战争、粮食发展史等众多不同专业领域。如果你不对这些专业领域有深厚研究和理解,就很容易被忽悠。即使要研究如何促进生育率提升,也需要考虑房价、教育、生育投入产出等众多不同专业领域。如果只是以“某个领域的问题不存在”(如粮食绝对不存在问题)等借口去完全屏蔽某个必要专业领域的研究,在这类必需全科型或准全科型知识结构才能有效研究的领域,就必然会得出错误和纯属战略忽悠的结论。

如果一种必须全科型知识结构才能研究清楚的领域,实际却是建立在残缺知识结构的基础上,所导致的结果必然是一种“残缺性学术”。当前有大量怪异的学术观点,并不是因为他们有什么创造性,只不过是因为它们没有完备地研究应当研究的所有相关专业领域,从而必然存在不同的残缺而导致的。

3. 中华民族文明复兴的需要

中华民族的文明复兴已经成为今天中国、全球华人和世界各国有识之士的共识。问题是:如何才能真正实现中华文明的复兴?是仅仅从中国老祖宗的古纸堆里翻出来一些东西去世界上推广就可以的吗?当然不可能。复兴肯定不能简化成古迹翻修,而是必须站在当今全人类一切最优秀文明成就(当然也包括中国自身最优秀文明)的基础之上,继往开来、去创造性地开拓全新的未来人类文明。要做到这一点,就必须从整体上清楚地、完备地把握当今整个人类文明、尤其是科技文明的一切成就,这就必然要求具备全科型的知识结构才能真正做到。所以,通晓能力是真正实现中华文明复兴的基本功,不具备这种基本功,就必然存在一些深刻的约束和限制,真正的中华民族复兴就可能只是幻想和奢望。

中华民族的复兴当然需要能够超越一切人类文明,包括当代的一切西方文明和古代中国的文明成就,使得人类的文明能够迈上一个全新的台阶和层次。如果不具备全科型的整体视野,怎么可能做到这一点?

4. 交叉学科研究的需要

事实上,现代科学已经越来越进入跨学科的时代。因为在任何单一方向上,已经越来越遭遇理论极限了。宇宙大爆炸的时间也就138亿年,而现在人类开发的望远镜已经接近可以看到138亿光年远的宇宙。整个宇宙可以被认知的极限也就是930亿光年的直径。对撞机可以测量的下限已经接近可以制造的技术极限。这也是中国大型对撞机CEPC和SppC争议很多,迟迟定不下来的关键原因所在。

但是,这并不意味着说人类的科学发展就可以停滞了。纵向走得越来越难,意味着横向走(横向交叉)的必要性就越来越大。即使是很多纯粹某一学科内部的问题,往往也是需要依赖于该学科以外其他学科专业的知识来解决。中国也越来越重视跨学科和交叉科学的研究。

2020年12月30日,国务院学位委员会、教育部发布《关于设置“交叉学科”门类、“集成电路科学与工程”和“国家安全学”一级学科的通知》(学位〔2020〕30号),设置了交叉学科门类(代码14),和两个一级学科(代码分别为1401、1402)。

国务院学位委员会又于2021年11月17日印发实施《交叉学科设置与管理办法(试行)》(学位〔2021〕21号)。

经中央编办复字〔2020〕46号文件批准,国家自然科学基金委员会于2020年11月成立交叉科学部,成为基金委的第九个学部。

图片

国家自然科学基金委上的介绍

交叉科学部下设综合与战略规划处和另外四个分别管理不同交叉学科方向的处室。

图片

官网上的各处室职能介绍是:

综合与战略规划处:负责组织相关专家和科学处进行交叉学科战略研讨;制订项目资助和学科发展战略;统筹各类基金项目与行政经费的年度预算、资源配置和资助计划等;负责科学部各类项目的综合管理;制订交叉科学研究的评价机制及管理办法;负责科学部信息与网络建设、政务管理和运行保障等;承办科学部领导交办的其他任务。

交叉科学一处:基于数学、物理、化学等基础学科的交叉科学研究,面向国际科学前沿和国家重大需求,解决信息、生命、材料、能源、环境等领域的核心基础科学问题,取得重大突破或形成新的学科增长点。

交叉科学二处:基于先进材料、现代工程、信息技术等领域的交叉科学研究,面向国际科学前沿、国家重大需求和经济主战场,解决我国社会发展过程中相关的工程控制、先进制造等领域的关键科学和技术问题。

交叉科学三处:面向人民生命健康,基于理学、工学、医学等领域的交叉科学研究,发展生物医学前沿技术方法,阐明生命相关复杂系统的多层次跨尺度相互作用与调控机制,揭示生命现象背后的科学规律和共性原理,探索生命健康研究新模式,应对人类健康与疾病防治中的重大挑战。

交叉科学四处:基于自然科学的理论和方法,采用多学科会聚、多工具融合的交叉科学研究手段,研究人类社会发展过程中的资源开发利用、全球变化应对、人类文明演化、自然-社会耦合互馈等宏观复杂系统,解决人类可持续发展中的重大科学问题。

这些交叉科学研究的进展当然会推动相关领域的进步。但是,交叉学科的交叉可能性,是一切学科相互之间进行交叉,以上不同处室间的学科也很可能是相互交叉的。所以,最好的交叉学科研究是基于全科型的知识体系,这就需要通晓能力为基础。因此,真正的准确概念不是“交叉科学”,而应当是“全科型科学”,“通晓型科学”。

5. 各专业学科有效及高效学习和研究的需要

正因为现在科技知识信息大爆发,更需要掌握全科型的方法。因为缺少全科型的认知方法,很多专业学科自以为的新研究成果,事实上早就在其他学科研究过了,只要简单拿来就可以获得更为完善的解决。这反过来导致了更多无效的,重复的学习和研究投入,带来更多重复的知识信息。具备全科型的认知方法,即使只考虑单一的专业学科的学习和研究,也是最为有效的、高效的,甚至是越来越必须的。

6.其他

当前,美国对中国贸易战输了,科技战,生物战,军事竞争,台海挑拨等都失败或越来越处于下风。除了粮食战争、核战争,还有一个可能的优势就是舆论战。而美国舆论战的绝大多数手段和着力点,都是利用了缺乏全科型认知能力的缺陷,人为制造和利用残缺性学术的认知。因此,全科型知识是有效应对美国舆论战最有效的武器,可对其一剑封喉。

另外,面对以GPT为代表的通用人工智能的爆发,人们只是在感叹它会取代哪些职业,但为什么不去考虑另一方面更重要的问题:在AI的时代,我们人类自身该如何发展和提升?成为全科型人才,是人工智能时代提升人类自身最重要的出路。人工智能最大的优点就是它不断在进步和演进,人类自己也需要不断地进步。进步的最简单途径就是能够具备通晓当代人类一切知识的全科型认知能力。

二、通晓的难度

全科型知识结构和通晓能力的必要性和好处是显而易见的,问题只是其难度,或者说表面看起来的难度太大了。

1. 数量太大

这个数量太大不仅是人类存量的知识信息量太大,而且仅每年新增的知识信息从纯粹的数量上来说,就大到一个人要想全部接受的话,都难以想象的程度。

以美国国家科学委员会2022年1月发布的研究报告为例,2020 年全球S&E论文(科学与工程论文)产出达到290万篇。从2010年到2020年,全球S&E论文产出的复合年增长率为4%。一个人别说是把一年内的所有论文全看完,仅仅把每年全球所有S&E论文的标题、作者、摘要、关键词等(假设平均为每篇论文有200字)看完,相当于要阅读5.8亿字,连做到这个都是极为困难的。假设一个人以每1秒钟10个字的超快速度阅读,其他什么事都不做(不吃饭、不睡觉、不上厕所)一直连续不断地保持这个超快阅读速度,也需要671天(接近2年)才能读完。

互联网上的流量不仅规模巨大,增长也极快。2020年全球互联网流量相比十年前增长15.9倍。2022年,仅中国移动互联网接入的流量就达2618亿GB,同比增长18.1%(数据来自工信部)。

2022年,仅中国上市新书就有17万余种,这还是相比2021年减少了约2.5万多种的情况。一个人要在一年内读完这17万种图书,同样是一个难如登天的工作,更别提全世界图书总量。

2. 差异悬殊

不仅知识信息的数量巨大,其学科差异也非常多,学科的类别成千上万。

根据中国《学科与分类代码》(GB/T 13745-2009),包含科学、工程技术与哲学、艺术、宗教等所有学科知识,共有62个一级学科或学科群、676个二级学科或学科群、2382个三级学科。

中国教育部出台的《普通高等学校本科专业目录》(2023版),共分为13大门类、93个专业类和792个专业。研究生教育的学科有14大门类(增加交叉学科)、405个专业。

另外可作参考的还有:

  • 《中国图书馆分类法》从A到Z,L、M、W、Y未用

  • 《学位授予和人才培养学科目录》

  • 《国家教育部研究生专业参考目录》

  • 《美国国会图书馆分类法》(Library of Congress Classification,简称LCC)

  • 美国教育部国家教育统计中心(NCES)公布的《学科专业分类目录2020版》(CIP-2020)

当然,如果从专业研究学科数量的学者们视角来看,学科的数量会更多。例如下面这篇论文中提到的学科估计数量是近万。估计学科数量近两万的学者也有。

据统计,整个科学知识体系,迄今已包含近万门学科。自然科学的分支学科、边缘分支学科约有4000 ~ 5000 门,社会科学的分支学科、边缘分支学科约有近 2000 门,交叉科学的分支学科、边缘分支学科约有近 2000 门,哲学、数学、系统科学、思维科学的分支学科约有 1000 门左右。

图片

不同学科不仅意味着更多的知识信息,而且掌握他们的思维方式等也差异巨大,甚至完全相反。例如,数学要求极端严谨、具有理想空间的思维习惯,但别说是艺术,即使是科学的测量又要求理解到一切测量过程都必然存在的误差,并且要有极强的动手能力。软件尤其互联网软件习惯于迭代的产品改进方式,但在船舶领域,不可能给你迭代的空间。造航母哪能允许你不行了就卸载重装一个?机械与电子产品的流水线组装,化工的高炉,矿山的开采,农作物的生长,牲畜的养殖与放养,房地产、道路桥梁、机场港口的建造业工程建设......各个行业差异之大,思维方式之不同,会使得习惯了某一个领域的人,在另一个领域以往的知识很可能成为巨大的障碍。

3. 资源获得的困难

相比于前两者,其实更困难的是相关资源的获得。有些知识你可以到图书馆找本相关的书来读就可以。但真正要学好一门知识可能涉及到很多业内的实际资源。例如学习生物学,如果根本没有见识相关物种的机会,学习起来就非常难。要学习计算机,如果连计算机都没有,要学习从何谈起呢?

4. 其他

虽然以上困难都是客观存在的,但更大的困难还是认知上的,当前全世界几乎所有学者都认为今天一个人要具备通晓能力是一件不可能的事情。主观的观念上就认为不可能,那就根本不会去想,更不会去做,也就不会寻找到解决问题的办法。

三、通晓能力的基本原理——消除冗余

1.基本原理——消除冗余

即使有如上所述的巨大困难,具备通晓能力依然是可行的。首先我们来讨论其可行性和原理。尽管表面看起来现代人类知识信息的存量和新增数量都无比巨大,新增量还在不断增加,所有知识信息相互间的差异悬殊,但深入研究就会发现,其存在大量的冗余。所谓“冗余”,就是重复的,并非真正新增的东西。例如,互联网上流量巨大,但绝大多数都是属于“复制——粘贴——转发”这类操作,并没有多少真正的新内容。

俗话有云“天下文章一大抄”,我们当然不能说所有文章都是抄的,当前通过网络对文章查重的能力也很强,论文审查的一个重要方面也是查重。但这种查重仅仅是说不要最简单地复制,如果改个名字,进行下简单的修改,查重软件就未必能查得出了。在有查重软件的条件下,通过简单修改,实质还是重复的内容依然占据论文的主导。每年290万篇科技论文,真正属于新研究发现或创新的内容能有千分之一甚至万分之一就不错了。

如果直接去阅读人类当前的知识信息存量及增量,这肯定是不可能实现的困难任务,但一切困难任务在被简化到一个人可以完成的程度时,它就是可行的任务了。从消除冗余的角度出发,就可以使通晓能力成为可行工作。

2. 信息压缩技术的参考

以消除冗余进行简化本身都不算是全新的发现或方法。信息压缩技术中已经有非常全面成熟的消除各类信息冗余的方法,我做的工作只不过是将其总结扩展到知识领域而已。此处先系统介绍下信息压缩技术的原理和方法。下面介绍的排序,是大致按普通人或非信息压缩技术领域的专业人员理解起来从易到难的顺序进行,并且为了使人们理解更容易,只解释原理,并不完全是实际使用中的术语表达。

  1. 消除重复的信息冗余。简单重复就是最主要的冗余。消除重复,也就是一种最普遍、最简单的消除冗余的方法。例如,在存储技术中就有“查重”的功能,如果有两个存储的信息块是完全一样的,就可以把其中一个不再存储,只在信息目录里标注它和另一个相同就可以了。这样就省掉了一半的存储量。如果有N个信息块是完全一样的,就可以接近节省N-1倍的存储量。在视频的信息压缩中,有可能某一段视频是静止的,那么,只要保留最初的一帧图像,后面可以用最少量的信息标注上与第一帧完全一样就可以了。这样只需要一帧图像加上极少量标注的信息,就可以存储或传递很长一段静止视频信息。如果是网上转发或复制粘贴的信息,当然只要看最原始的原创内容,其他就可以不用看,也不会对信息接收有任何知识内容损失。在传真机的信息传递技术中,因为要传真的一般是文件,而文件上的文字信息其实只有“空白”(可以用0表达)和有文字(可以用1表达)两种情况。如果一行一行地扫描,就会形成一长串0和1组成的信息。因为文件的特点是要么为大段的空白(很长一串0),要么为一长段(如横线)也可能是一小段(如文字的一竖被横向截取一小段)1。如果有110个0,需要重复传110次0,但如果只传“110个0”这样的信息,就可以极大地减少信息传递量。

  2. 消除绝大部分重复、少量差异的信息冗余。很多信息相互间不一定是完全重复,而可能是绝大部分重复,只有一小部分是有差异的。处理方法可以是只存储或传递两个信息有差异的部分,其他部分标注上相同即可。例如在视频压缩中,对于并非绝对静止的视频,可以先传最初的一帧完整信息的图像(这个叫初始帧,一般用字母I表达 ),后面只传与初始帧有差异的部分(称为预测帧,一般用字母P表达)。由于有差异的部分是极少的,所以可以节省大部分重复的信息量。这个方法在视频压缩技术中叫“运动估计”或“运动预测”。另外还有双向预测帧B,是根据前后两帧来计算B帧的偏差值。最新采用的小波变换,可以更好地提取图像中重复的对象块,使得计算差异部分的信息量尽可能更小。

  3. 变换与丢弃次要的细节。信息变换是一种相对抽象和复杂的方法。例如最主要的离散余弦变换(专业名称叫DCT),其原理是把图像中某一块原始空间域的图像信息变换成频率域的信息。这个变换要真正实现信息压缩,一般需要与丢弃细节信息的操作相配合。它是把体现细节且数值极小的高频分量直接丢弃掉。因为在一帧图像内部从空间上看有变化的部分,在频率域是体现细节的高频分量,而大部分变化较小(大块相同或相近颜色亮度的部分)的是低频分量。可以说,低频分量是一帧内存在的重复或大部分重复的像素信息。通过空间与频率域的变换,大块相同或相近的图像,其频率分量就集中在低频部分,中高频部分绝大部分数值为0或非常接近于0。将接近于0的频率分量直接丢弃(归0),会有细节损失,但损失极小,从而可实现“有损压缩”。有损压缩虽然会带来信息损失,但影响非常有限,并且对于不同目的来说,可能会允许不同程度的信息损失。这一点是非常重要的,允许损失的信息量越多,就可实现越大比例的信息压缩。

  4. 熵编码。常见的熵编码有:香农(Shannon)编码、哈夫曼(Huffman)编码和算术编码(arithmetic coding)。它的原理是根据消息出现概率的分布特性而进行的无损数据压缩编码。出现概率比较多的信息就采用更短的编码,出现概率较少的信息就采用更长的编码,这样在保持信息熵不变的前提下,最后总的编码信息量更少,从而实现无损的数据压缩。

  5. 其他。信息压缩也是一个专业细分学科,相关技术还有很多。但熵编码、DCT、小波变换、运动估计等就是目前实际应用中最主要的技术。人们在电脑中经常使用JPEG等压缩图像使用了熵编码和DCT,压缩视频等使用了熵编码、DCT、小波变换、运动估计,而文件压缩中一般主要使用的是无损压缩的熵编码。

四、获得通晓能力的原理

1. 基本原理

事实上,通晓能力的基本原理与信息压缩技术有极大的启发性和延续性,只是知识压缩更多体现在关注实际内容上(可称为语义)的冗余,而不是表面信息表达或编码的冗余上。例如对同一个知识点,仅仅换一种说法来表达,虽然从表面信息表达上看是很少重复的,但实际内容上却可能完全重复。举个简单例子,是换一种自然语言来表达相同知识内容。

中文:太阳从东边升起。

English: The sun rises from the east.

以上两个句字从表面的信息表达看是高度不同的,但从实际内容看又上是完全一样,完全重复的。在信息压缩中,无论是消除重复,还是有少量差异的重复,DCT变换,运动估计(预测)等,都需要有一个初始的基础,这个基础(在视频压缩中是初始帧I,在图像压缩中是最低频的分量)需要全部信息。要想实现知识的压缩,也需要找到类似初始帧I这样的“核心知识集”。这部分知识是需要全面吸收的。一旦有了这个基础,就主要关注未学习知识与核心知识集之间的差异量,就可以快速学习了。

举个例子,只要系统学习了数学上最具普遍性的数理统计学,其他几十门“XX统计学”(生物统计学、医学统计学、药物统计学、人口统计学、森林统计学、劳动统计学......)的专业学科,你只要学习一下它们与数理统计学之间有差异的地方,一门这样的学科长则几天时间,短则半个小时就学完了。这个就叫“触类旁通”。要实现触类旁通,一定是绝大部分一样,只有少量差异的不同知识体系。只要明白了这少量的差异,整体就全明白了,会有“一点就通”的感觉。所以,虽然知识压缩与信息压缩在原理上几乎一样,但在方法上信息压缩侧重消除冗余的方法,而知识压缩则是侧重核心知识集的建立。我们先来说下基本的消除知识冗余的方法和原理。

2. 消除知识冗余

要对知识进行压缩,从而可以用最少的时间和精力投入获得最大量的知识,关键也是要消除知识冗余。其方法原理与信息压缩也是类似的:

  1. 消除重复的知识冗余。转发、复制拷贝粘贴、摘抄、引用......这些都是纯粹重复的知识。当然,即使纯粹重复的知识再看一遍,可能也有加强学习和记忆的效果,但不会带给人新的知识。

  2. 消除绝大部分重复、少量差异的知识冗余。评论、综述等还算是有点技术含量的“绝大部分重复、少量差异”,有很多纯粹是换个说法、但又稍加点个人理解。

  3. 静态差异、动态差异、高阶动态差异。静态差异就是通过横向比较不同知识点之间存在的差异,而动态差异是随着时间的变化,同一领域的知识点会出现的变化。如果总结出知识信息随时间变化的规律,就可以只关注动态差异与变化规律之间的偏差,从而使差异尽最大可能地减少。例如摩尔定律就是著名的半导体发展变化的规律,但它并不是绝对准确的,实际发展会与它有一定偏差,那么只要关注实际发展与摩尔定律之间的偏差,就可以用最少的知识信息量去把握半导体发展的变化。后者就是高阶动态差异。

  4. 适当丢弃次要的知识细节。如果要求掌握一切细节知识信息,即使有了上述消除知识冗余的处理,其数量可能依然会大到无法实现完全接受。但如果适当丢弃次要的知识细节,只在需要时去深入特定专业的知识细节,就可以节省大量的次要知识和信息量接收工作。

五、通晓能力的基础——核心知识集

1. 数学

数学是整个科学的核心基础之一,这一点不仅所有学者都会同意,而且在这个方面因数学本身的语言体系也比较统一,所以不会有争议。只是需要说明一下数学本身并不是一个单一的学科,而是已经成为一个很庞大的学科群。从对科学的意义和价值角度来说,可以把所有数学分为三个层次。

最基础的层次:数理逻辑与数学基础。它是现代公理化方法,可对比一下古希腊亚里斯多德的第一原理及四因说:质料、形式、动力、目的。这个是为科学提供最基础的逻辑。

建立在严格公理化基础上的、具有演绎性的数学知识:如数论、代数学、代数几何学、几何学、拓扑学、数学分析、非标准分析、函数论、常微分方程、偏微分方程、动力系统、积分方程、泛函分析、概率论、运筹学、组合数学、离散数学、模糊数学、数理统计等。

可能存在近似的数学方法:计算数学、应用数学、计算机数学等。

理论上说,一切科学都必须以数学作为其逻辑基础。但现代科学的不同学科中对数学的应用程度是不同的。尤其是公理化方法并不是在所有学科中都能以最严格的方式遵守,甚至包括在理论物理学中,有些学者都认为并不一定能遵守最严格的公理化方法。在化学等学科中,更是难以采用公理化的方法。但这种情况的存在并不能否认数学、包括公理化方法是一切学科都应当树立的标杆。

我在这个方面所做的突破性工作是通过引入时延,有效解决了循环因果律的问题,也就是把循环因果律还原成了经典因果。这个突破可有效解决大量以系统科学等为核心的现代科学方法(系统论、控制论、协同学、混沌学、超循环理论、耗散结构理论、突变论)与经典科学的统一问题。

2. 统一测量学

这个领域是我工作的重点。数学与统一测量学是一切科学的两大基础,是最重要的两大核心知识集。有了这两个核心知识集的支持,一切科技领域的专业学科都只不过是用相同的工具去做一道新的作业题而已。过去,各个学科在数学术语和方法上是比较统一的,但在实验与测量问题上却是各自为阵,专业术语各不相同。这种“只是换个说法”是知识信息冗余的最重要体现方式。很多在统一测量学角度来看已经在某些学科中有效解决了的实验和测量问题,在其他各个细分学科中不仅是大量低水平地重复解决,而且解决得不完备甚至是错误的。这种实验与测量领域的“低水平重复建设”问题非常严重。以下就是各个学科对实验和测量上“只不过换个说法”的结果:

物理学   实验
化学   实验、化学分析、仪器分析、计量化学
天文   观测
地质   勘探
生理   解剖、活检
历史   发掘、探方、测年、断代
新闻   采访、访谈
社会   调研、考察
经济   计量经济学
军事   预警、战场感知、态势感知、侦察、情报

……

我曾问过很多计量经济学(也有叫经济计量学,Econometrics)的教授和专业学者,是否理解这个学科中的“计量”一词是什么概念?几乎无人能回答清楚。这个是当然的,别说是现在这个学科专业的人,就是创立这个学科,给这个学科起了这个名字,并且因这些工作获得第一届诺贝尔经济学奖的拉格纳·弗里希(Ragnar Frisch)和简·丁伯根(Jan Tinbergen)等人,他们都没搞清楚,你们怎么可能搞得清楚。当初他们是仿照“生物计量学”(Biometrics)一词而起的名字。但“生物计量学”又是个什么来历呢?牛津大学有个在测量学领域影响很大的学术刊物叫Biometrika,与生物计量学是同义的。这个学术刊物虽然名字叫生物计量学,但事实上就是测量学的专业刊物。一个很著名的例子是测量学中的“学生分布”,也叫“t分布”,提出这个方法的最经典论文“平均数的规律误差”(The Probable Error Of a Mean),就是1908由威廉·戈塞(William Sealy Gosset)以“学生”的名义发表在Biometrika刊物上。

所以,生物计量学准确地说就是“生物测量学”。经济计量学准确的术语应当叫“经济测量学”。术语的偏差会带来什么后果?就是低水平重复建设,而且是有众多残缺和错误的低水平重复建设。

系统学习了“统一测量学”,这些学科也就是半个小时就可以学完、并且获得的知识会比经济计量学完备、准确、有效得多。学完经济计量学以后,可能还是不知道该怎么去测量市场需求尤其微观个人或单一企业的市场需求、各个行业的甚至具体到某个企业某个车间的详细生产过程、各种交易过程,但学完统一测量学后这些都不是个事儿。经济计量学能做的事情,统一测量学绝对的100%都能做,并且比经济计量学做得好上十倍、百倍。因为统一测量学是一切科学测量的全集。而统一测量学能做的事情,有很多经济计量学做不了。大致来说,计量经济学主要是采用统计学的方法,针对于宏观经济或某些行业的宏观经济数据进行统计,在此基础上的一些建模、模型预测等。

3. 学科的本质——最大程度的精简

为什么有了数学和统一测量学这两大核心知识集以后,还是需要各个专业学科?这就涉及到学科的本质在第三代科学条件下该如何理解的问题。过去人们只是简单地认为科学就是分科而学,但事实上学科是某一些知识积累到一定程度,可以从中抽取出核心知识集,这样就可以最大程度地对知识进行精简。

但是,学科一旦出现,会带来重大的现实社会的影响,因为学者群会按照学科进行分工,学校,研究单位,职称评价等都会按照学科进行归属。发表论文的学术刊物也会按学科进行定位。这样一来,就会使学科带来社会现实的巨大影响。从纯粹科学的角度说,学科本不应当受社会现实左右的,但事实上并非如此。这是我们需要充分意识到的问题。

4. 八大专业核心知识集

  1.  心理和精神
  2.   机械
  3.   化学
  4.   生物、农业、医学
  5.   电子信息、软件
  6.   金融
  7.   法律、政治、管理
  8.   战争、竞争、竞赛与博弈

以上八大专业核心知识集的详细介绍参见《实验、测量与科学》第十八章 如何获得全科型知识结构。此处要说明的是,获得了这些专业方向的核心知识集,就可以在相应领域实现触类旁通,而不同核心知识集之间可能会使专业人员有隔行如隔山的感觉。这种核心知识集当然可以更加细分,甚至细分到某一个很狭窄的课题。当然,人们可能会分出不同的,或者更加细分的核心知识集。这些核心知识集的形成不仅仅是因为他们表面上的知识更为接近,而且是因为其思维方式,基本方法等都具有相通性或从另一角度说就是更大的冗余性。

获得这些大的专业领域知识集是以数学和统一测量学两大最核心的知识集为基础,同时可以通过阅读相关领域一些经典著作或经典论文。经典著作之所以成为经典,是因为他们可以更适合承担该领域核心知识集的载体。它们虽然最初学习起来可能很困难,但当学完了以后,再学该领域其他著作或论文就非常容易了。
从理论上说,第三代科学的全科型方法和通晓能力在单一学科内也可发挥强大的作用。它不仅可以极大节省单一学科内学习新知识的难度,而且可以使任何单一学科知识更为完善。只是在目前阶段,我个人的工作还是更主要把通晓方法应用在现在所说的交叉学科或跨学科研究上。因此,我常对人说,如果一个问题解决不了,最好去找这个领域优秀的专家。如果很优秀的专家解决不了,就去找这个领域最顶尖的,诺奖级的权威专家。如果这个领域最顶尖的权威专家也解决不了的问题,你再来找我。这样说当然不是人家这个领域最顶尖的专家专业水平也还是不够,而是说这样的问题往往就是因为问题本身远远超过该专业学科范围,涉及到其他学科,尤其是大量其他学科专业,需要用到全科型和通晓能力才可解决的。如果只是涉及跨越其他一、两个学科,可能找到相关领域的专业人员请教一下别人就可能解决问题。但如果跨越的学科专业太多,例如达到10个、几十个甚至更多时,一方面把这么多不同专业学科的专家凑在一起本身就太难,另一方面即使是能把他们凑在一起了,相互之间也几乎无法沟通,不知道你到底想干什么。我希望人们能真正认识到通晓能力在各种场合都可以具有的价值。一般各个领域的人都不太欢迎非本专业的人跑过来发表意见,因为很容易导致外行之言,并且这样的人往往只是喜欢简单地从其他专业角度进行指责,但又不能真正解决问题,别人也不好说什么。而我抱持的原则就是只去为各个领域解决问题,不是添乱,更不是去抢属于别人的饭碗。因此,无论我在任何领域写文章和书,基本上都会得到这个领域专业人士甚至最权威专家的欢迎和认可。

致谢!在此感谢杨学志博士将他博士后论文提供给我作为写本文的参考,正好其主题是研究小波变换在遥感图像处理中的应用,论文中有非常丰富的信息压缩技术介绍。

参考阅读:

概念跨学科定义法——第三代科学方法论介绍

第三代科学意味着什么?

上交大学术讲座:第三代科学与经济学

第三代科学与我们的机遇

通晓当代所有科学文明成就——中国如何领导世界(六)

CEO小班课:第三代科学

科学地证明科学始于测量

正确的认知来自科学的测量方法

图片

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多