WordNet中的动词
Collins英语词典中有43636个不同的名词和14190个不同的动词,动词的多义性比名词更突出。Collins词典中,名词平均意思为1.74,而动词是2.11。 (一) 动词在WordNet中的组织方式 1 将词库变成按语义组织的域 (breaking up the lexicon into semantic domains) 为了将英语动词词库组织成一个关系网络,将词库分成语义域来组织似乎是一个好办法,这有两个理由。第一,它提供了一个对英语词库中数千多义动词的初步的,基于语义的组织方式;第二,对这方面素有研究的研究人员已经指出通过语义和词汇关系联系起来的那些词语通常都属于同一个语义域(semantic domain)。 对动词进行分类,第一刀可能是分成event和state两类,而大多数动词可能属于前一类,这一类又进一步分成14个更专门的类: verbs of motion (詹按:这里原文似有错误,出现了两个perception,有重复。另外,在文后所附动词语义基本分类中有weather/气象类,这里没有提到) 上面这个分类,部分基于Miller 和 Johnson-Laird 1976年的讨论,部分基于这种分类本身的合理性,因为这样分类似乎可以令得所有动词都有一个适合的类。当然,其他的研究人员可能有不同的分类方式,但是,不管是分类的数量还是类的名称,就WordNet中对动词词库进行分析的观念而言,都不是非常重要的。 上述这15个类是适合WordNet中所有动词的分类需求的。在多年发展之后,WordNet 1.5版大约包含11500个动词同义词集合。但是,必须强调,动词义类之间的界限是模糊的。比如许多动词无法毫不含糊地归入cognition类,也无法归入communication类。比如 wonder, speculate, confirm, judge等等。类似地,像 whistle这样的动词,在“The bullet whistled past him”中的whistle,既可归入sound emission类(发出声音),也可以归入运动类动词(motion),参见Atkins 和 Levin 1991的讨论。如果这样的动词被判定为是单义的,它们就不得不归属一个以上的语义类中。在WordNet中,是倾向于把这些动词处理为多义动词,如果一个动词确实可以归入两个语义类(semantic domain)。不过,一个动词归入那个具体的语义类,并不是件很要紧的大事,因为在WordNet中,一个动词的意义是通过它跟其他动词的关系以及同义词集合(synset)来表达的。 2 动词的第一级分类(起始类 unique begineer): Lyons(1977)提出一个分类集为:act, move, get, become, be, make。 如果采用可替代性作为判断同义的标准,那么只有很少的动词是同义的。rise和fall可以选择抽象名词如“temperature”(温度)或“prices”(价格)等作为论元,但它们相近的同义词ascend和descend则不行。WordNet原则上避免把这样的动词放到一个同义词集合中。不过,由于许多显然属于同义的动词之间也存在类似的分布差别,因此注释和样例就显得很有帮助了,通过注释和例句,我们可以看出同义动词之间在使用上的差异。 像“kick the bucket”和“keep an eye on”这样的固定成语包含在适当的同义词集合(synset)中,那些有比喻意义(非字面含义)的动词也是如此,比如“die”可以用在汽车抛锚或计算机死机的情况下,因而die在WordNet中也被包含在break和break down所在的同义词集合中。有比喻义的动词不仅意义上跟相关动词相近(如die跟break和break down),而且用法上也有同样的句法特征(如die跟break和break down都是非宾格动词),并且一般可以用被动形式加以解释(如This task fell to me中的非宾格动词fall就可以解释为be assigned;The building went up中的go也可解释为be erected,等等) 尽管有相当多的研究工作研究说话人对名词和形容词的语义记忆,但心理语言学家不太注意研究动词的语义记忆问题。动词的词联想数据是稀疏的。WordNet的设计基于例证关系,而不是适应不同句法类词语之间的直接链接。 除词联想数据外,替换错误也是研究词语和概念的心理组织的数据源。Garrett(1992)报告,说话人在一些动词的替换使用中出现错误情形,如ask和tell,go和come等。显然,这些动词对来自同一个语义范畴。这些替换错误被Garrett分类成反义对:start-stop, remember-forget, believe-doubt, ask - tell, preced - follow, fill - empty, love - hate, heard - said, taken - given。等等。这些动词对跟那些在刺激-反应实验中发现的联想动词对类似。(Palermo & Jenkins 1964, Chaffin, Fellbaum, and Jenei 1994)。在后一种心理实验中,反义是刺激和响应之间的一种主要关联。这类心理语言学证据表明,语义相反关系是说话人组织心理词库的一种重要方式。WordNet即包含了许多这样的动词对。 来自典型性和成员隶属程度判断的数据对词语和概念的研究也是一个很好的数据资源。不过这方面的研究同样也主要集中在名词上,例外是Pulman的研究工作(Pulman 1983)。他的主题是判断一些动词比另一些动词更典型地隶属于某个范畴。例如,murder是kill这个范畴的典型成员,隶属程度很高。survey则是look这个范畴的典型成员,相反,sacrifice和squint,之于kill和look,则都不太典型。这样的结果对心理词库建模是有帮助的。但是,Pulman的数据只局限于8个范畴,每个范畴涉及6个动词。 传统的词典在发现词语和概念之间联系方面提供了丰富的资源。名词通常用上位词来定义。词典也给出了动词的分类层级启示。例如,动词shuffle在韦氏词典(第三版)中被定义为,“to move or walk in a sliding, dragging manner without lifting the feet”; shout被定义为,“to utter in a loud voice.”这种类型的定义显示,一些动词是另一些更通用的动词经过一些修饰造成的。另一些动词不大好找上位词,就用它的否定方面来进行定义,例如,lose被定义为,“fail to sustain, maintain, or keep”。(这类似于词典在定义形容词时用“not X”这样的形式)。词典在定义许多动词时还采用“x while y-ing”这样的形式。这种定义有助于启示继承关系。许多有及物和开始状态的动词在词典中是以“to become or make X”的形式定义的(例如melt/使融化,被定义为,“to become or make liquid”)。在WordNet中,这两种意义是加以区分的,并通过CAUSE指针链接。 有些动词之间存在蕴涵关系,如snore(打鼾)蕴涵了sleep(睡觉)。“He is snoring”蕴涵了“He is sleeping”。动词之间的蕴涵关系很像名词中的meronymy(整体部分关系)。 人们接受上述事实,就可以认为这样的动词对是部分-整体关系的,如drive 是 ride的一部分;snoring 和 dreaming(做梦)是sleeping的一部分等。因为当一个人drive(驾驶)的时候,他必然是ride(乘)在交通工具上的。从时间性上讲,前一个动词必然在后一个动词发生的时段内。 动词之间不同于名词之间的上下位关系,用来测试名词之间上下位关系的句子框架:An X is a Y,不大适合用来测试动词。Ambling is walking,To amble is kind of to walk或者Mumbling is talking都不被接受。 Fellbaum和Miller(1990)创造了一个术语troponymy来称说动词中的下位关系。动词之间的troponymy关系可以表示为公式:To V1 is to V2 in some particular manner. 这里Manner可以解释为多种语义维度,比如fight的下位词包括battle, war, tourney, joust, duel , feud等等,这些词都是从不同角度更具体地来刻画一个fight。 下位关系是一种特别的蕴涵关系。march是walk的下位动词,march同时也蕴涵walk。walk被包含在step中(即walk蕴涵step),但walk不是step的下位动词。snore蕴涵sleep,但snore也不是sleep的下位动词。 动词层级分类体系通过下位关系实现,倾向于浅层分类。在大多情况下,分类层级不超过4层。例如: Communicate - talk - [ babble / - mumble / - slur / - murmur / - bark ] - write 在动词分类层级体系中,动词下降一层,该层上的动词所能搭配的潜在论元(名词)的多样性也就相应地下降。例如figure(图形)或picture(照片)可以communicate和talk,甚至还可以deceive(欺骗)或lie(撒谎),但它们不能fib(撒小谎)或perjure(作伪证)了,只有人可以fib或perjure。有时候,把一个动词安置到单个的上位动词下非常困难。这跟名词的情形有些类似,例如piano在WordNet中既是一种“stringed instument”(弦乐器),同时也是一种“percussion instrument”(打击乐器)。就动词的例子而言,sprawl既可以是四肢分开地sit(坐),也可以是四肢分开地lie(躺)。Pulman(1983)提到,许多动词用于表示杀人的不同方式(比如hang, stangle, shoot, 等等),既可以是kill的方式,也可以是execute(行刑)的方式(即killing某人实际上是一种惩罚的形式,这样的惩罚是由社会提出加以制裁的)。人们希望语义上下位关系可以使得语义记忆模式显得经济一些,即下位概念的属性可以从上位概念继承。对动词的上下位语义层级分类,目标也同样如此。communicate(三价动词)的下位动词就从它们的上位词继承论元结构 -- 即communicator(发信者), message(信息), recipient(接收者)等。同样地,尽管speak的下位动词之间可能在方式上各不相同,但它们都共享speak的词义联想内容(声带振动,嘴唇和舌头的动作等等) 动词词库的关系指针OPPOSITION实际上代表了复杂的若干种语义关系。例如, converse是一种反义关系,这种反义关系没有共同的上位词或蕴涵动词,比如give/take; buy/sell; lend/borrow; teach/learn等等。这些词的共同之处在于出现在同样的语义场中,指称同样的行为,但各自联系的表层句子结构中的论元角色不同。 大多数反义动词是状态动词。这样的动词可以通过属性来表达各自之间的反义关系。如live/die; exclude/include; differ/equal; wake/sleep等等。 此外反义关系也经常出现在变化动词中,如lengthen/shorten; strengthen/weaken; prettify/uglify等等。 跟形容词中的反义关系类似,动词中的反义关系也存在标记问题(markedness)如,tie/untie和appear/disappear,前者是无标记的,后者是有标记的。 许多语义上相反的动词在分类层级上是姐妹关系(co-troponyms),比如rise/fall,walk/run等。 另有一些语义相反的动词对,共同蕴涵一个动词,如fail和succeed都蕴涵try,forget和remember都蕴涵know等。 这种关系连带两个动词概念,一个是因(如give),另一个是果(如have)。英语中词汇化的致使动词对的例子如:show - see(展现 - 看见)和 fell - fall (击倒 - 倒)等。 此外,WordNet包含从致使(causative)动词和及物动词,到相应的非致使动词和不及物动词的CAUSE语义关系指针。这主要出现在变化动词中。例如blacken, develop, break, shrink等。大多数非致使动词暗示了一个有生施事或无生的致使动因(如The glass door broke -- The storm/ The children broke the glass door)。少数动词只跟无生致使动因相关,如The wooden deck molded -- All that rain molded the wooden deck。比较:The house sitter molded the wooden deck是不合法的句子。致使动词也系统地出现在运动动词中,如bounce, roll, blow等等。(She blew a soap bubble in his face -- The soap bubble blew in his face)。Carter(1976)提到,致使关系是蕴涵关系中的一种特殊情形:如果V1必引起V2,则V1也就蕴涵V2。比如expel/驱逐和leave/离开,或bequeath/遗赠和own/拥有。跟所有的蕴涵关系一样,致使关系是单向的(unidirectional)。
据Fellbaum(1990),英语动词中的多义词大约是名词的两倍。那些高频动词(have, be, run, make, set, go, take等)的意义通常依赖于跟它们共现的名词。 如behave既可以表示“conduct oneself”,又可表达“conduct oneself well”,后者(behave2)是前者(behave1)的下位动词。这就是所谓的自我上下位关系。 2 多义性与蕴涵:自我蕴涵关系(Polysemy and Entailment) 韦氏大词典第三版列有drive的两个义项如下: to operate and steer a vehicle; 请看例句:The president drove on to the Capital. 在这个例句中,drive的上述两个义项的意义区别就不再清晰了,因为总统可能是驾驶汽车的人,也可能只是乘客。再前一种情况下,“他驾驶”就蕴涵了他同时也是被交通工具承载的人。 再如:She sewed her dress 是一个歧义句。 sew有两个意思,一是fasten or join(fabric) by stitching(靠缝合使织品更紧凑或连到一起);一是make or create by sewing(通过缝制生产衣服)。后一种意思蕴涵前一种意思。因此,如果这个例句是“她做了一件衣服”的意思,则这个例句蕴涵“她通过缝合使这些布片紧凑地组织到一起”的意思。
Horn(1988)指出,在例1和例3中,动词选择“goal”(目标)论元;而在例2和例4中,动词选择的是“source”(来源)论元。同样形式的动词在不同的用法中构成自我反义关系。
例5和例6之所以不合法,是因为在一个句子中,同时包含了上述两种论元(语义上不相容)。
(五) 测试WordNet的语义模式的心理合理性(Testing the psychological validity of the wordnet model)
Chaffin, Fellbaum,和Jenei(1994)完成了几项试验,目的是测试WordNet中动词关系的心理现实性(psychological reality)。 首先,Chaffin, Fellbaum和Jenei想看看未经语言学训练的人是否能确定许多动词对之间的不同关系。被试者需要完成涉及四种蕴含关系(troponymy, proper inclusion, backward presupposition, cause)的三种不同任务。在一个类比任务的测试中,48个被试首先看到1个动词对(verb pair)——作为种子对,并被要求从另外6个动词对中选出1对来,而这一对中的成员之间的关系应该跟种子动词对中两个动词之间的关系相同。差不多一半的回答跟WordNet中的分类不一致。 在第二个分类试验(sorting experiment)中,另外一组12个被试被要求对四种关系的例子进行整理分类。这个任务允许给被试更多自由来显示他们自己的分类。一个层级聚类的分析显示,被试确定的四种主要的关系类,跟WordNet对四种Entailment的分类是大致相当的。 最后一个试验的对象是有40名被试的第三组人,他们拿到的是显示不同Entailment关系的动词对,要求他们造一个推论句(rationale sentence),来详细说明动词对之间的关系。结果显示,被试同意WordNet中关系的分类,尽管很少有被试造出的具体句子(用来描述这些关系的句子)是重合的。在这个实验中,对Troponymy关系有最高的认同度。而且Troponymy在第一个类比试验中也是被试给出答案最准确的,在第二个分类试验中也是一致性最高的。在所有三个实验中,基本都达到了最低限度的一致性。proper inclusion关系和presupposition关系似乎在直觉上低于troponymy关系和cause关系。 1 语义场理论 (semantic field) 从语义场理论的视角来看词典的结构,有些类似WordNet中的语义域。语义场分析方法的基础是这样一个信念,即一个给定语义场中的词的意义来自于它跟该语义场中其他词之间的相似和相反关系。但是,语义场分析跟WordNet中的情况还有所不同,语义场分析通常既考虑聚合关系(paradigmatic),又考虑组合关系(syntagmatic)。在WordNet中,关于一个词的选择优先性的信息不是网络结构的一部分,而更倾向于是跟一个同义词集合(synset)相伴随的说明性材料,这样的信息通常具体地标示什么样类型的名词是作为一个Synset中的动词的典型论元出现的。 2 脚本和框架分析(Schemata and Frame Analysis) 一些语言学家和词典学家认为纯粹的关系分析对描述说话人的动词词库表达是不够的。他们提议采用认知框架或者知识脚本来描述说话人的经验和信念,并提供表示词语意义的概念基础(例如Schank和Abelson, 1977)。 Fillmore和Atkins(1972)提议编纂一个基于框架的词典。在这样的词典中,词语意义跟认知结构或框架相连。比如商业交易框架(commercial transaction frame),其中包括{money, buyer, seller, goods}以及动词{buy, sell, charge, cost, etc.}。 尽管WordNet并没有把动词跟特定的名词关联起来,但它提供了每个动词的句法框架,来指示动词的确定数量的论元。但是,在这样的句法框架中的名词槽,目前既没有跟论旨角色(thematic role),也没有跟像buyer这样的语义范畴联系起来。 因此,WordNet可以在这方面有所加强,即在跟动词的每一个synset相伴随的框架中,可以将语义和论旨角色跟名词论元关联起来(link)。这样,原来处于反义关系(opposition relation)中的动词对,如buy和sell,就可以在名词论元的差别上显现出来。 3 义素分析(compositional analyses) 尽管通过组成成分的意义来建构整体的意义这一处理方式跟从关系角度来刻画词语意义不大相同,但二者之间仍有重合之处。WordNet中通过词语之间关系来刻画词语意义,其中也反映了义素分析的某些方面。比如在义素分析法看来,give这个动词的组成成分之一是CAUSE,而在WordNet中,这是通过give跟have这两个动词之间有CAUSE关系来体现的。 4 词汇从属理论(lexical subordination) Levin 和 Rapoport(1988)指出,许多动词在语义上实际由其他动词组成。例如: 例1 brush the tangles out -- remove the tangles by brushing 再比如:he nodded his assent (他点头表示同意) 在WordNet中,nod是一些基本动词的Troponym,比如nod的一个义项就是“express by nodding”。它的上位词是gesture(体态语),类似的词包括nod, shrug, wink等。 (七) 语义关系和句法规律性(Semantic relations and syntactic regularities)
对动词的语义和概念组成成分进行分析能够揭示出许多动词的句法属性。词汇概念结构相同的动词倾向于有共同的句法行为。Levin(1985, 1993)测试了大量的动词,语义上同类的英语动词,在句法模式上也有系统的对应性。 1 有区别的子树(distinguishing subtrees) 同一层级的动词的句法属性一般就是对这类动词进行次分类的基础。 例如:weave(编织), mold(铸模)这两个词都是creation verb(创造类动词)。许多创造类动词都可以有下面这样的句式变换(材料/成品 交换句法位置): 例1 She wove a rug from the black sheep's wool. (她用黑绵羊的毛织了一个毯子) 例2 She wove the black sheep's wool into a rug. 例3 They molded a head from the clay. (他们用粘土塑了一个人头) 例4 They molded the clay into a head. 有一些动词,像fabricate(编造)和compose(写),也是creation类动词中的成员,但不能像上面的动词那样变换句式。例如: 例5 The reporter fabricated a story out of the girl's account. (那个记者根据那个女孩所说的编出了一个故事) 例6 * The reporter fabricated the girl's account into a stroy. 例7 She composed a quartet out of the old folk song. (她根据这首老民歌创作了一个四重奏) 例8 * She composed the old folk song into a quartet. 在Fellbaum 和 Kegl (1988)对这些动词的讨论中,他们指出,有必要对创造类动词进行更精细的分类,一类是精神上的创造活动(如fabricate和compose),一类是对具体材料的加工(如weave和mold)。这样的区分就能解释这些动词在大多数情况下的系统差异。 WordNet注意到了上述区别,因而将creation类动词区分为“create from raw material”和“create mentally”两类,尽管这两个概念在英语中并没有词汇化。 2 动词在树结构中的位置的句法意义(syntactic reflexes of the verb's position within a tree structure) 从语义关系的角度观察动词同样也提供了理解动词句法性质的一条线索。Fellbaum和Kegl(1989)研究了英语中的一类动词(涉及到及物/不及物的变换)。例子如下: 例9 Mary ate a bag of pretzels. (玛丽吃了一袋椒盐脆饼干) 例10 Mary ate. 以往对这些动词的分析根据时态来进行解释。但是,对eat的下位动词的分析显示,可以将这些动词分为两种情况,一种是必须以及物用法出现,一种是总以不及物用法出现。前一类包括gobble, guzzle, gulp和 devour等(基本上都相当于汉语的“狼吞虎咽”),后一类包括dine(进餐), graze(放牧,吃草等), nosh(吃点心), snack(吃零食)等。Fellbaum和Kegl提议,上述句法性质的差异并不仅仅是及物变换方面的不同,而是由语义激发的差别。他们认为,英语中有两个eat,分别占据语义网上的不同位置。不及物的eat的意思是“eat a meal”(吃饭)。它的下位词一部分来自名词,如dine, breakfast, picnic, feast等。另外一部分是munch, nosh, graze等。相比之下,及物的eat的意思是“ingest in some manner”。这种意义下,eat的下位词是指以特定方式eat的那些动词:gobble, gulp, devour,等等。 3 中间形式制约 (Restrictions on Middle Formation) 一个明显的结构是那些通常需要副词或副词短语出现才能站住的句子。比如: 例11 Her new novel sells * ( fast / like hotcakes ) 例12 This car drives * ( easily / like a dream ) 但是,有的情况下对副词出现与否就要求不高。比如: 例13 This vegetable microwaves (easily). 例14 This suitcase zips shut (in a flash). /* 这里shut时表示结果的形容词 */ 对副词出现与否的限制要求可以用动词的语义层级来说明。下位动词对副词出现与否的要求相对宽松。例如:cook有许多下位动词,包括 fry, broil, braise, microwave等等。这些动词都表达了cook的某种特定方式。同样地,close的下位动词包括velcro, button, zip, snap等。这些动词都表达了以特定的方式来close。我们来看两个上位动词的例子: 例15 This vegetable cooks * ( quickly ). 例16 This suitcase closes * ( easily ). 在上面这两个句子中,副词都是必需的。因为其中的动词是“基础”层级(basic level)的动词,在人们的心理中,这样的动词本来就被期待是与特定的名词(它们的主语)相关联的。如果这些动词只是简单地来陈述它们的主语,就引不起听者特别的兴趣,因此,特别说明这些动词的具体方式(通过副词来表现)就是必要的,而且是自然的了。注意,这些句子的重音都落在副词上。 相比之下,如果动词是下位动词,副词性修饰成分就不是必需的了。因为这些动词本身就已经能给出新信息。microwave 意味着 “cook in a microwave oven”。 zip 意味着 “close with a zipper ”。 Ackerman和Goldberg (1996)注意到下面的例子,也可以从动词语义层级的角度来进行解释。他们注意到,一些来自动词过去分词的形式不太适合出现在名词前位置作限制性定语(attributive) 例17 * a killed man 例18 * a changed design 例19 * a told secret 相比之下,如果动词在语义层级树上处在更下位的位置,它的过去分词形式就比较容易出现在名词前位置。 例20 a murdered man (一个被谋杀了的人) 例21 an altered design (一个被更改了的设计) 例22 a divulged secret (一个被泄露的秘密) Ackerman和Goldberg得出结论说,这些不适合作修饰成分的动词,都没有提供足够的信息来限定它后面的中心动词,他们提出如下原则: 一个形容词性的动词过去分词如果来自基础层级的动词,就不适合作修饰语出现在名词前位置修饰限定中心名词,相反,如果动词是更下位的谓词,它的过去分词形式就容易起修饰作用。
附: --------------------------- 动词的基本语义类: 1. 身体动作动词(Verbs of Bodily Functions and Care); 275个同义词集合 |
|