配色: 字号:
1新闻信息模糊测度初探
2022-04-10 | 阅:  转:  |  分享 
  
新闻信息模糊测度初探秦月李易如何对新闻进行定量描述,是新闻学研究中的难题之一。本文试图运用现代数学的重要分支——模糊数学,对新闻信息的
测度做一初步的探讨。(一)马克思主义哲学原理告诉我们,任何事物都有质的规定性,同时也有量的规定性。世界上没有无质之量,也没有无量之
质,事物总是质和量的统一。对发展变化中的客观事物,只有从质上也从量上加以统一把握,才能准确地揭示事物的固有规律。正因为如此,从原则
上讲,对任何事物都应当也能够进行定量描述。而数学,就是从数量这一侧面研究一切事物的科学,既适用于研究自然现象,也适用于研究社会现象
,当然也能用来研究新闻现象。数学在理论上具有很高的抽象性,在应用上具有广泛的适应性。那末,在新闻学等社会科学领域,为什么至今还没有
实现研究上的定量化呢?基本原因有两个:一是社会现象中的数量关系十分复杂,特别是由于受着人的主观因素的支配,传统数学不能对复杂系统中
庞杂的数量关系做出精确的描述;二是长期以来,在自然科学与社会科学之间,被不恰当地划开一道人为的鸿沟,人们习惯上把数学只当作研究自然
现象的工具,数学方法在社会科学中的应用不够普遍,不够成熟。人类历史进入二十世纪中叶,特别是新的科学技术革命兴起之后,数学科学有了巨
大的发展。适应性更强的现代数学,和系统论、信息论、控制论这类新兴的横向学科一起,作为“公共的科学方法,架起了沟通自然科学和社会科学
的桥梁,加速了自然科学与社会科学一体化的进程。数学方法用于研究社会现象的必要性、可行性和有效性,显示得越来越清楚。从这里,人们也看
到了实现新闻信息定量描述的希望。?当然,我们不能从忽视定量分析,走向夸大数学方法在新闻学研究中的作用。新闻学研究的基本手段是定性描
述,根本方法是马克思主义的哲学方法。运用数学方法进行定量分析,只能是一种辅助性手段。而且,定量分析要以定性分析为基础,以定性分析为
指导。没有对新闻本质的科学把握,无法对新闻正确地进行量上的测度。可以说,我们过去对新闻本质的某些认识,是不利于对新闻进行定量描述的
。无疑,新闻作品含有传者的情感和意志。如果说对情感和意志难以进行定量描述的话,对“知情意”中的“知”却可以做出量上的测度。而“报知
”则是新闻作品的基本成分和主要功能。近些年来,我国新闻界的看法日趋一致,认为新闻在本质上是一种信息,是及时公开传播的新近事实的信息
;而信息则是接受者需知又未知的事理,是对接受者认识上不定性的消除;信息或新闻的传播过程,基本上是一种报知过程,即消除受众认识上不定
性的过程。有了对新闻质的规定性的如上认识,就为从量上测度新闻打开了通路。在下面的论证当中,我们将始终坚持定性分析与定量分析相结合的
原则,把新闻视为一种特殊形式的信息,寻求出测度其报知作用大小即消除不定性多少的可行又可靠的方法。(二)?既然信息是接受者需知又未知
的事理,是对接受者认识上不定性的消除,那末,一篇新闻作品的信息含量,就是它对受众认识上存在的不确定性所消除的数量,或说是针对受众的
不定性提供的确定性的数量。而一篇新闻作品所消除的不定性的数量,由下面三个层次来构成:一是作品使受众对事物状态的认识消除了多少不定性
,即对事物是什么模样提供了多大确定性,这用状态肯定度来描述,叫做语法信息量;二是作品使受众对事物状态的含义的认识消除了多少不定性,
即对事物状态具有什么含义提供了多大确定性,这用逻辑真实度来描述,叫做语义信息量;三是作品使受众对事物状态及其含义的价值的认识消除了
多少不定性,即对事物的价值大小提供了多大确定性,这用效用度来描述,叫做语用信息量。也就是说,一篇新闻作品的信息量大小,决定于它使受
众对事物的状态、含义和价值,在认识上发生了多大变化。这就告诉我们,一篇新闻作品的实际信息量,就是受众接受这一新闻前后认识上的不定性
之差,或说确定性之差。接受某一新闻之前,受众对所报道的事物在认识上存在着相当大的不定性,同时也可能存在某种程度的确定性,这叫“先验
肯定度”;接受这一新闻之后,受众原有的不定性减少了,确定性增加了,这叫“后验肯定度”。后验肯定度减去先验肯定度,所得差数便是这篇作
品所提供的信息量。如果能从信息这一头求出先验和后验之差,用来表述新闻作品所消除的不定性的数量,亦即信息量的大小,那是最理想不过的了
。然而,常识告诉我们,这是不现实的。新闻传播过程的信宿即接受者,是具有情感、意志和巨大主观能动性的人,是主观因素和客观条件相差悬殊
的社会群体。它们对同一事物的状态特别是对事物状态的含义和价值,认识和评价的能力与标准千差万别,从而对信息的理解和接受也千差万别。这
就为从信宿这一头测度新闻的信息量,特别是测度其中的语义和语用信息量,带来难以逾越的障碍。正因为如此,信息论和控制论的创始人,才调头
从新源着手,寻求测度信息量的可行办法。信息论和控制论的创始人在研究通讯和控制过程时,权且把信源视为语言文字等符号集。如英文的二十六
个字母和一个空格,就是这样一个符号集合。每个符号的出现,叫做一个状态。不同符号(状态)携带的信息量各不相等。比如,字母A携带的信息
量是3.97比特,字母B是6.56比特。一则电文的信息量,是电文中出现的各个符号所含信息量的总和。那末,各个符号大小不等
的信息含量是怎样确定的呢?信息论的创始人规定,每个符号的信息含量由它在这种文字通常使用中出现的平均概率来确定,并用概率的对数来表示
。比如字母E在英文写作中出现的概率是0.105,其信息量(IE=-log2105/1000)为3.25比特;字母Q
的概率是0.001,其信息量(IQ=-log21/1000)为10比特。符号出现的概率越小,带来的信息量越大,概率越大,
带来的信息量越小。也就是说,经常出现的状态不足为奇,消除不定性的作用有限,因而信息量小;不长出现的状态一旦出现,使人耳目一新,消除
的不定性很大,因而信息量也大。这是符合人们的经验和常识的。显然,狭义信息论对信息量的测度,运用的是概率统计这一传统的数学工具。而且
,它所测度的是文学符号的概率信息,并不是对客观事物状态的发生概率直接进行测定,更没有把客观事物的状态含义及其价值大小统计在内,完全
舍弃了对语义和语用信息量的描述。这样的度量方法,对研究通讯技术过程是可行的和有效的。因为在拍发电报等通讯过程中,对传发单位来说,不
必关心电文的语义和语用,只求这一端发出的信号能在另一端复制出来,就算完成了通讯任务。但在新闻传播过程中,只从量上统计文字符号的概率
信息,却是远远不够的,或说价值是不大的。近些年来,人们受到狭义信息论的启发,一再做出运用概率统计对新闻信息进行定量描述的尝试,其中
主要是试图通过确定新闻事实的发生概率,来表述新闻信息最的大小。但实践一再证明,此路难以走通。按照马克思主义哲学原理看问题,通讯过程
的终极信源当然不是语言文字等符号集,而应当是发展变化中的客观事物,新闻传播过程中的信源自然也就是大大小小的社会事件即新闻事实。然而
,对纷纭复杂、千变万化、层出不穷的自然现象和社会事件,其发生概率多数是无法确定的。更何况新闻作品中尚有许多非事件性新闻,确定它们的
概率更无从着手。信息论的创始人为什么把信源权且视为语言文字等符号集,而不去直接统计确定自然状态和社会事件的发生概率,原因恐怕就在这
里。退一步说,假定新闻事实的发生概率能够测定出来,由此测出的也还只是新闻的语法信息量,即新闻事实的新奇程度。不容怀疑,“概率越小信
息量越大,概率越大信息量越小”,这一定律对衡量信息量的大小具有相当普遍的意义。凡新闻总要带点新奇性,平谈无奇、毫无特色的事实,一般
不能够成为新闻,尤其不能成为好新闻。但对新闻如果只有这一层次的要求,只求语法信息量之大,不在同时追求语义和语用信息量之大,就有可能
走向猎奇的极端,导出“狗咬人不是新闻,人咬狗才是新闻”的错误结论。由此可以看出,单纯运用概率统计等传统数学方法,在信源这一头也没有
圆满解决对信息的语法、语义和语用三个层次进行综合测度的问题。同时也告诉我们,在对新闻信息进行定量描述时,不能简单机械地照搬狭义信息
论的测度方法。(三)信息科学的发展历史证明,综合测度语法、语义和语用三个层次的信息量,只靠传统数学是无能为力的,需要选用新的数学工
具。笔者认为,运用现代数学的重要分支——模糊数学的方法,对综合测度新闻信息可能是简便宜行和行之有效的。模糊数学,是研究模糊现象的数
量关系的一门新兴学科。在许多情况下,对立的事物之间表现为“非此即彼”,界限分明,用传统数学可以精确地刻画出它们之间的数量关系。但在
复杂系统中,特别是在社会领域和思维活动中,现象与现象之间往往界限并不分明,很多现象以中介状态存在,具有“亦此亦彼”的模糊特性。比如
“高与矮”、“美与丑”、“冷与热”、“老练与幼稚”、“稳重与浮躁”等等,都是表述模糊现象的模糊概念。对这类复杂而模糊的现象,不可能
用传统数学方法求出精确的绝对数值加以刻画。如果硬要精确刻画它们量的规定性,不但徒劳无功,反而使认识和表述变得更不准确。切实可行的办
法,是运用模糊数学对它们的数量关系做出相对或近似的描述。运用模糊数学的方法,并非使人的认识停留在或变成为模糊不清的状态,而是使模糊
现象的模糊程度在认识上降低到无关紧要的地步,使无法精确计算的模糊现象能从量上得以相对精确的把握。一篇新闻作品的信息含量,大体由作品
反映的新闻事实的新奇性和重要性,作品满足受众需知的广泛性和消除受众未知的深刻性来决定。而新奇性、重要性、广泛性和深刻性等等,均属模
糊集合和模糊概念,很难像称东西那样测度出几斤几两之类的绝对数值,只能用新奇的程度、重要的程度之类相对数值来表述。这就使新闻作品的信
息含量,天然具有模糊性。用糊模数学测度其模糊信息量,应当说是顺乎研究对象的要求而进行的合乎客观实际的定量描述。比如,我们设定新闻作
品深刻性的理想程度为1,对三篇新闻作品的深刻性加以测度,甲作品的深刻程度达到了0.9,乙作品的达到了0.7,丙作品达到了0.5。
这就叫做测定“隶属度”,即确定作品符合某一概念(如深刻性)的程度。对三篇作品的新奇程度,重要程度和广泛程度,也一一进行类似的测度,
最终对每篇作品都从四个方面测度出四个数值。对四个数值之和加以适当处理,便是该作品信息量的相对数值。并且,三篇作品信息含量的差别,也
可以从数值上一目了然地比较出来。这些数值虽然是相对的,近似的,但终于使模糊不定的新闻信息量有了较为确定的描述,使人的认识更加逼近客
观实际,有了从量上相对精确的把握。?表面看起来,这样的测度方法似乎相当粗疏,有些简单化了。创立于1965年的模糊数学,最初就曾受到
类似的非议,指责它使数学丧失了固有的精确性,使数学发生了退化。其实,这全是误解。二十年来的历史证明,模糊数学本身虽然还没有完全成熟
,它却使数学方法应用到传统数学无法解决的模糊现象这一禁区,解决了传统数学无法解决的许多复杂向题,显示出模糊数学具有强大的生命力和渗
透力。它在医学、心理学、气象学、生物学、地质学、经济学、语言学和情报学等领域的应用,都取得了令人称道的成果。由于模糊数学能够模拟人
脑的思维方法,它将在人工智能这一最新学科当中显示威力,促使电子计算机实现更高程度的智能化。因此,实现新闻信息的定量描述,寄希望于模
糊数学的应用,是不会落空的。(四)运用模糊数学对新闻信息进行综合测度,大致需要经由如下几个环节。1、设定构成新闻信息量的要素集,记
为??U=(U1,U2,U3,…,Un).?如前所说,构成新闻信息量的要素,是由新闻的本质属性决定的。设定要素集时,要遵循三
个原则。一是充要性。即设定的要素应当是决定信息量的主要因素,它们能够充分地把信息量反映出来,要素之间不能互相重叠和互相包含。二是一
致性。即要素之间可以相互制约但不能彼此对立,失去协同。三是合理性。即设定的要素应易于测量,或直接可测,或间接可测,或心理可侧。根据
如上原则和要求,构成新闻信息量的主要要素,可以设有五个:一是真实性,记为U1。只有如实地反映客观事物,新闻作品才能向受众提供一定
量的信息,保证新闻的状态肯定度、逻辑真实度和效用度是正值。如果报道失实,特别是做了假报道,不但不能消除不定性,反而使受众的认识从原
有的不定性,趋向更大的不定性。在这种情况下,作品带来的就是负信息,即信息量的负值。真实性既是对语义信息量的规定,也是作品信息总量为
正为负的前提和界定。二是新奇性,记为U2。新奇性包括新闻事实的特异性和新鲜性,对受众来说的未知性,以及报道和传播的及时性。新闻事
实越新鲜、越有特色,越是针对受众的未知及时传发,其信息量越大。新奇性基本上是对语法信息量的规定。三是重要性,记为U3。重要性包括
新闻事实的重要性和新闻主题的重要性,即新闻报道抓取的问题对社会进步和群众实践具有重要的实际效用。显然,重要性基本上是对语用信息量的
规定,它和新奇性互相制约又相互辉映。既新奇又重要,信息量更大。四是广泛性,记为U4。广泛性指的是受众接受面的大小,新闻发生作用的
范围大小,即消除不定性的广度。新奇又重要的新闻,读者面未必就大。如关于某些科研成果的报道常是如此。新奇又重要的新闻只有广为人知,其
实际信息量才大。要达到这一点,必须增强新闻的针对性和可读性,为受众喜闻乐见。五是深刻性,记为U5。深刻性是衡量作品对客观事物的本
质和规律揭示深浅的尺度,或说是对社会实践中和受众思想上存在的问题回答深浅的程度,亦即消除不定性的深度。既广泛又深刻,消除的不定性即
提供的信息量肯定很大。2、设定要素测度的等级序列,记为V=(v1,v2,v3,…,vn)。对新闻信息量的构成要素设定之后,接着需
对各要素设定一个程度高低的等级序列,使隶属度的确定有一个约定的标准。如对新奇性、重要性、广泛性和深刻性的理想程度设为1,其可能达
对的程度且定为“0.99,0.9,0.7,0.5,0.3,0.1,0”这样七个等级。当然,也可以在“0,1”之间划分出任意多个等级
。但任何一篇新闻作品的新奇性、重要性等等,都不可能达到尽善尽美的程度,故而等级序列的上限不能定为1,只能定为接近1的0.99
,或小数点之后的任意多个9。然而也有一个例外,即真实性的上限可以定为1。彻底深刻是做不到的,准确无误、毫无虚假却是可能也
应当做到的。常识还告诉我们,一篇新闻对事实的反映只要有一部分是失真的,全篇作品就成为不可信的,就丧失了全部信息量。因此,在设定要素
测度的等级序列时,只给它设定三个等级,即“1,0,9,-1”。并在运算公式中,把它们作为系数来处理,记为k1=(1,?0.9,
-1)。当作品完全真实时,系数为1,决定作品的全部信息量为正值,当作品只发生无关紧要的细节失真,其真实程度仍在90%以上者,系
数一律为0,9,从而使新闻丧失10%的信息,当作品的主干事实失真,真实程度在90%以下者,系数一律为“-1”,从而使新闻的全
部信息量变为负值。3、确定各个要素的隶属度隶属度也叫从属度,即事物符合某一概念或性质的程度。确定隶属度,是对新闻信息进行模糊测
度的关键坏节。如前所说,隶属度用[0,1]闭区间的实数序列来表示。当我们设定了五大要素的等级序列之后,确定隶属度就是用五大要素
衡量新闻作品,看它在多大程度上符合各个要素的要求,达到了等级序列中的哪一级。比如作品A,真实性的隶属度为0,新奇性的隶属度为
0.7,重要性的隶属度为0.5,广泛性的为0.9,深刻性的为0.5。这样,作品A的隶属度向量可记为:μA=(μ1,μ2,μ3
,μ4,μ5)。隶属度的确定,一般有两个途径。一是主观途径,也叫“心理量表法”,实际是靠有实践经验和专门知识的专家来评估。如对体操
运动员和演唱艺术家的表演,就是知名专家评判做出量上的测度。二是客观途径,也叫“数理统计法”,这需要通过统计或实验获取大量数据来确定
。后者准确,但工作量很大;前者带有主观色彩,但简便宜行,大体可靠。如果参与评估的是一专家集团,评判结果取其平均值,这样做的可靠性更
大些。4、加权运算。用上一步所得出的作品A的隶属度向量,在对五大要素均等看待的情况下计算信息量,还是不科学的,应进一步对它们做出加
权运算。如果把真实性当作限定因素进行特殊处理,剩下的四大要素对构成信息量所起的作用,则是大小不一,不能等量齐观的。这就需要对四大要
素在信息总量中所占的比重加以设定。比如,可以把四大要素的权向量定为:A=(1.2,1.2,?0.8,0.8).(这里,Σ
Ai=4,i=2~5)这就是加权或说赋予各要素以不等的权数。有了各要素的隶属度和权向量,就可以给出公式,计算作品的信息
含量。公式为:I=-K1ΣAilog2(1-μi)(比特)(i=2~5).式中,K1为真实性的三个系数;Ai为四
大要素的权向量;μi为四大要素的隶属度,(1-μi)是为了将隶属度变成与概率对应的一个信息量的反函数。5、根据新闻的特性,对运算
公式加以改进。新闻的新奇性对构成新闻信息量具有特殊作用。当新奇程度等于零,即在新闻事实毫无新意或所传内容受众早已知道的情况下,决定
新闻作品的整个信息量也等于零,无论其它要素的隶属度多高,也是如此。这一情况在公式里应当反映出来。需要引入一个系数K2。当μ2=0
时,即在新奇性等于零的情况下,系数K2=0,在其它情况下,系数K2=(1,0)。改进后的公式为:I=-K1K2ΣAi
log2(1-μi)(比特)(i=2~5)仍以作品A为例,按改进后的公式计算信息量如下:I=-l×1×[1.2
×(-1.73)+1.2×(-1)+0.8×(-3.32)+0.8×(-1)]=6.72(比特).(五)有了如上的论证和推演
之后,还需做几点说明:(1)一篇新闻作品的语法、语义和语用信息不是各自独立存在的,而是相互重叠、相互交触在一起的。因此,把它们作为
一个整体,进行量上的综合测度。(2)本文采用的信息单位是国际通用的单位——“比特”,但和纯用概率统计得出的比特单位,在内涵上不尽相同,在数量上亦无一一对应关系,它只是借用来的相对的计量单位。(3)一篇新闻作品的信息含量虽然不取决于文字的长短,但几十个字的短讯一般没有几千字的通讯信息量大。设有深刻性这一要素,可以说照顾到了这一情况。极少的文字是不可能深刻地表述新闻事实的。(4)新闻作品信息量的大小,不是评判新闻优劣的唯一标准。评估新闻作品的优化程度,除了要看信息含量,还要从政策尺度、简练程度等方面加以权衡。(5)对构成新闻信息量的要素,以及各要素的内涵,新闻界的看法未必一致,我们的设定和解释也未必科学。至于行文中的概念推理和公式演算,都难免有不当之处,希望能够得到行家和同仁的指教。7438郑州大学学报(哲学社会科学版)1987(3):21-27.附:武汉大学何微同志来信德生同志:我曾到兰州调查,刚返校,复信迟了请谅。……定量化方法一段,我看过后并请魏丽老师编程序在计算机上运算,是准确的。因使用数学模型,在新闻界推广有一定困难,可否稍加文字论述,我可以向刊物推荐,请您参考。敬礼!何微(19)87-5-12
献花(0)
+1
(本文系新用户6607m...首藏)