分享

北松:莫迪亚诺小说中地理与情感关联的分析

 置身于宁静 2024-02-02 发布于浙江

这是我第一次主动向社长要求发布一篇文章。

之所以这么厚颜地毛遂自荐,一是因为我和组员们近期的确因为这个项目吃了苦头;二是因为,在做了这个东西以后,我发现自己对文学的认知发生了深刻变化。作为一个半路出家的伪文学人,我长期以来一直深陷某种误区,即把文学分析视作高中阅读理解的高阶版,而文学理论不过是镶花边而已。
在做完这个项目后,我忽然发现,“文学分析”这个原本面目可憎、模糊不清的概念,在我心里却已焕然一新——原来文学也可以是“科学的”、“客观的”,就像工科和理科那样。

在南木这样一个以文学、文字为主导的社区,创作自然是重中之重但我认为,在注重创作的同时,写作者也不该排斥一些新鲜的、理性的关于“文学”之为何,与“文学分析”是在做什么的思考。

这篇文章比较详尽地还原了我作为法国文学研究生,所做的一个文学分析案例。

记录下来,既是给自己留个底,也是给有志于专业文学分析(非创意写作)的读者们看一下,法国高校是怎样做文学分析的,对文学的关注点,以及问题意识又是怎样的。

在正式开始之前,我先简单介绍下我们学校的这门课程。

课程名称为Humanité Numérique(数字人文),主打用信息技术分析文学;课程分为两个部分,上学期学发展史,下学期则是实操为主,期末考核是做一个用信息技术分析文本的小项目,所以我们这段时间一直忙于找软件,换软件,学习软件使用,着实是耗了一番力气

I. 前情介绍

我们研究的题目是:帕特里克·莫迪亚诺小说中出现的巴黎地,与人物情感之间的关联。

不太了解的读者可能要问,莫迪亚诺是谁?为什么要研究他小说里的地哇?

先简单地科普下莫迪亚诺:这位作家至今最响亮的名头是2014年诺贝尔文学奖得主,但这并不意味着他的小说都是佶屈聱牙的阳春白雪恰恰相反,他的小说都是“去贵族化”的,文字简单得不得了而他又是出了名的不爱写长篇,所以作品个个都是小书薄册,省事易读,除了有时候会被他飞来跳去的时间线绕得有点晕以外,整体的阅读感还是上佳的。

这个作家还特有二战情结,小说里的男主永远在“找”找什么呢?——找战争的余迹。这种有点“癫”的找寻心理,和他的原生家庭密不可分。莫迪亚诺的家庭是很散、很飘萍的,他的父亲是犹太人,两次在巴黎被德军逮到警察局,又两次虎口逃生,平时靠混黑市倒买倒卖生存。他永远神出鬼没,假名多得儿子都记不住;莫迪亚诺的母亲是个三线小演员,活得十分风流,诞下莫迪亚诺和他的弟弟鲁迪以后,大部分时间都在做甩手掌柜,甚至于朝儿子要钱、卖儿子的东西抵债,以此维持生计。

即便是成年的莫迪亚诺,在小说里,他的视角也永远是孩子的,困惑的。他眼见着父亲东奔西藏,眼见着母亲的朋友们入狱,眼看着警察做笔录、抄家,却不能明白发生过什么—— 所以他必须要“找”,找二战中活下来的人,从他们的言语中推断父母的往事;如果找不到人,那么找到一个照片,一个电话簿,一个地址,也是很好的,这些都是顶珍贵的遗迹。有一回,莫迪亚诺自我调侃,说,“我走在巴黎的街上,感觉自己是活在现代的古代人”,指的就是这种放不下过往的心理。

随便抽一本莫迪亚诺的书,翻上个两三页,你肯定都会有这么个初印象:哟,这人怎么这么喜欢在小说里写地址?这地址多到我都读不下去,简直是干扰阅读啊!

我随机抽一段《暗店街》给你们看:

“我们的车子从阿纳托尔·德·拉福尔热大街,开上了格朗德·阿尔梅大道,我突然想跳下车去。要一直开到维尔达弗雷,我觉得是做不到的。但是应当勇敢些。在我们抵达圣克卢门之前,我得不断克服一种恐惧感——它紧紧地抓着我。这个人,我几乎不了解,他会不会把我引进一个圈套里去呢?但是我听他说着话,也就渐渐地放下心来了。他把他各个时期所干过的行业都告诉了我。起初.他在俄国人开的一些夜总会里干过,接着到香榭丽舍花园的朗热餐馆和康邦街的卡斯荣耶旅馆里谋生,后来又在其它的一些机构里混过事,最后才来开了这家座落在阿纳托尔·德·拉福尔热大街上的洒吧间。每次换工作,他总是遇到让·厄尔特尔——我们要去的就是这位朋友的家里——,因此他们已是二十年的老搭档了。厄尔特尔的记忆力也很好。他们两个人,一定能够解开我的谜。”

这么长的一段,它其实只有一个动作:主角坐在某人的车上,正前往下一处地点。可就这么一个简单的段落,偏偏被各种街道名“污染”了,什么“阿纳托尔·德·拉福尔热大街”、“格朗德·阿尔梅大道”、“圣克卢门”,对不解法语,不熟悉巴黎的读者来说,简直是生硌眼睛,毫无意义,越读越火大。

——那么现在,问题来了,这些地名真的没有意义吗?它们除了充当小说情节的GPS定位以外,就真的没一丁点作用吗?

让我们再大胆设想一下,如果说,我们能把他所有小说里的地名都揪出来,摆在卫星图上,能不能看出他更喜欢哪个地方、更讨厌哪个地方?

换句话说:或许,我们可以从他的“地理偏好”中,挖掘出他的情感偏好。

如果真能做到这一步,那可就是化“无用”为“大用”了。

II. 用信息技术做快速文献综述

2.1 初步抓取关键词(Voyant Tool)

好啦,现在的我们已经成功地拥有一个选题了:莫迪亚诺小说里出现的巴黎街道,究竟是随便写的,还是有用的?我们能否从街道的引用偏好里,推导出作家的情感偏向?

但在开始我们的分析以前,还得考虑下,这个题是不是已经被前人做过了?如果前人做过的话,那他们的结论是怎样的?

所以,我们的第一个动作是找文献,主要以“莫迪亚诺、巴黎、地理、地形学、地图、象征义”等几个关键词为抓点,广撒网,多捞鱼。经过筛查,我们得到了一批相关性非常强的文献,那么接下来的问题是,这些已有文献对莫迪亚诺所写的巴黎,有何解释?

如果从一般的写论文思路看,到这一步就该一篇篇地去啃文献了,通过阅读、记笔记、写综述,来概括出一个大体的结论。但是别忘了,我们这堂课是主打“信息技术”呀!这就意味着,我们可以心安理得地把阅读工作交给机器,让它们去解答文本分析的问题。

在筛文献的过程中,我发现了一个盲点:几乎所有文章,都不约而同地引用到了一位叫Montfrans的学者写的东西。

老规矩,擒贼先擒王,于是我把Montfrans的两篇文献都导入了Voyant tool之中—— Voyant-Tool是一个很容易上手的小白级文本分析网站,它的功能是,文章里哪些词用得最多,就给这些词做个排行榜,同时生成关键词云图,我们得到的结果如下:

 图片

图片

我来简单说明下,其实上下两张图是一样的,只不过下图是Excel形式的排行榜,上图是色彩缤纷的云图。排行榜最能反映情况:从上到下,词频由高到低依次为 rive(名词,河岸)、Modiano(莫迪亚诺)、 lieux(名词,地点), narrateur(叙述者)、rue(名词,街道)、pere(父亲)、droite(右)gauche(左)。

其中,排行第一的Rive(河岸)这个词,应当引起特别关注。

你肯定听过“左岸的咖啡”这么个说法,这里的这个“岸”,在法语里就是“rive”这个词。

下面这张图片展示的就是巴黎的区划,中间一条细细的蓝线=塞纳河,塞纳河下边=左岸(rive gauche),塞纳河的上边=右岸 (rive droite)。所以,“左岸”并不是我们想象中的一条河堤,而是涵盖了一整片的地理区域,下图中标注07, 06, 05, 15, 14, 13的市区,都属于左岸的范畴

图片

回到正经的分析上来:为什么“岸”这个词语这么重要呢?

这是因为,它显示出了学者们的一种解读趋势:即把巴黎一劈为二,假定左岸有某种内涵、代表某种意象,而右岸则是另一种意象。

仅凭借两篇学术大佬的文章,就推导出这个结论,显然不够靠谱。但它却给了我们一个清晰的思考方向:学者们怎么解读左岸?又怎么解读右岸?这两个区域各有什么意义呢?

前面说到,Voyant Tool仅仅是个初级分析网站,它做不到大批量的文本分析,所以我们不得不转移到另一个软件上去。这一次,我们的选择是Antconc

2.2 批量文本分析(Antconc

Antconc是个什么东西呢?这是一个可以做文本分析的单机软件,需要在电脑上下载(建议安装2020年的3.5.9版本)。当你打开页面的时候,里头是一片灰白,但最上方会有一系列的功能键,用以做文字分析。

首先,如果确定了要查找的关键词,那么就在导入文献后(txt格式),在主页面的左下角search term下输入单词,点击Start运行,你将看到,页面马上就被密密麻麻的词给覆盖了:

图片

上方不同的功能键,可以帮助做不同的分析。我简略地讲一下它们的用处,希望读者别嫌弃我啰嗦——

Concordance : 显示查找单词出现在哪些句子里。

Concordance plot : 显示查找单词,在全文的分布情况。

Cluster/N-grams : 显示查找单词最经常组成的“词组”。

Collocates : 一句话中,与查找单词,关联度最高的词。

Word list : 全文用得最多的词,做个排名。

我们之前说道,学者们喜欢把巴黎一分为二地去分析,那么我们所要关注就是“河岸、岸、岸”这几个词,并找到所有文献中,与它们关联性最强的词汇是什么——我们这里使用的是“Collocate”这个功能(即与search term关联度最高的词汇)。

当我们把这三个词分别输入进去,再运行软件以后,出现了下图的分析结果:

图片

图片

图片

到这里,其实结论已经非常明显了。简单来说,就是在各位学者们看来,在莫迪亚诺的笔下,巴黎右岸是黑暗的、被遗弃的、道德沦丧的、罪孽滔天的;而巴黎的左岸,则是天堂、堡垒般的,安全的,可供避难的。再简单点说,就是右岸=坏,左岸=好——而这个结论,是我们在没有实际阅读所有文献,仅在机器分析的情况下得出的。

那么,问题又来了,这种二分法的观点,到底是对的,还是错的,还是有对有错?

因为在我们之前,还并没有学者用机器算法来研究地点和情感的联系,他们只是基于情节去做一个笼统的概括。就好比说,红楼梦里的大观园是积极情绪偏多还是消极偏多?有人或许会回答,大观园前期是积极情绪为主,这与故事中贾家的繁盛有关;而贾家落难以后,和这个地理位置相关的语句,就多是消极的了——这种基于情节的分析是有道理的,但它也有很大的缺陷,那就是主观性会很强,没有具体的数据做支撑。

这就是为什么,我们接下来要用算法,来统计每句话的情感权重。毕竟,有数据才是硬道理。

III. 用算法分析情感色彩

这一步也是令我们最为难的部分,学了这么多年的文科,对于信息技术完全是0概念。不过好在市面上已经有很多成形的分析App, 用不着自己拿Python做出个新软件来,简直感激涕零。

这个部分,我们主要用到了两个东西:Textrics + Ariane,两个功能不同,但是能完美配合的软件。

首先,Textrics是一个做语句情感分析的AI,虽然我不懂它的运作原理,但它的神奇之处在于,可以把每句话的潜在情绪分析得超级精确,比方说莫迪亚诺《家谱》中,下面的这个句子是这样被分析的:

而战争到来的时候,他身无分文,过着拮据的日子(Violence, negative ;识别为消极情绪-暴力)。1940年,他让人把他的邮件送到庞蒂厄街24号的维克多-埃马纽埃尔三世酒店。在一封从昂古莱姆发给他哥哥拉尔夫的信中,他提到了他们在当铺租来的一盏吊灯,在那里他被遣送到一个炮兵团 (Appreciation, positive;识别为积极情绪:欣慰)。”

于是,我们就顺理成章地把所有小说文本都丢给了机器,让它做每句话的情感注释,再导出一个带情感值标注的文本。

但仅仅标注完情感值还不够,因为我们并不是想分析整篇小说,而是要揪出与“巴黎街道”相关的句子,包含了哪些情感。

这就是为什么我们又换了一款软件——Ariane。Ariane是一个可视化软件,它本身不做AI情感分析,但是可以做情感语句的关键词提取。也就是说,必须得先用Textrics做标注,再导到Ariane里做总分析,二者相辅相成。

下面这张五彩缤纷的图,就是Ariane的一个分析界面了:

1.左侧的彩色框框=不同的情感属性(这里我只截取了负面情绪,从上到下依次为灾难性的、危险的、病痛、死亡、厌恶、暴力、受难、脆弱)

2. 右侧=小说正文,高亮是什么颜色,就对应什么情绪

图片

Ariane的另一个好处在哪儿呢?在于它有关键词搜索框!下面这张图里,就是我们在输入关键词“街道”(rue) 以后,出现的文本。搜索词都被用三角形+高亮红色标注了出来。

图片

看了这么多图,是不是有点晕了?让我们再回顾一下研究的进展和亟待解决的问题:到目前为止,我们发现,学者们倾向于认为在莫迪亚诺的小说中,左岸=美好,右岸=邪恶。

于是呢,我们想通过AI,研究小说中与“街道”相关的句子都是什么情绪,究竟能不能用算法验证学者们的说法。

现在,我们已经获得了所有“街道”相关句子的情绪值。那么,接下来要问的是,一共出现了多少个街道?它们在卫星图上的位置,是巴黎的左岸还是右岸?它们在小说中的情绪是什么?

图片

在使用Ariane软件的输出功能后,我们得到了上面这样的统计表。以前三行为例,从左到右依次为:

1 马里昂街 | 纬度48.86 | 经度2.306 | 情感分类:厌恶

2 库尔岑内街  | 纬度48.76 | 经度2.163 | 情感分类:陌生

3 枫丹大街 | 纬度48.88 | 经度2.334 | 情感分类:危险

这个Excel表的作用是非常非常重大的,为什么呢?

首先,它点明了不同街道所在的经纬度——这就意味着,我们可以将它导入到某个卫星地图软件中,从而把数据在地图上可视化

其次,它还按积极情绪/消极情绪对地点做了分类——这意味着,我们可以在卫星地图里,生成几个不同的图层(一个是积极,一个是消极,一个是中性),然后用两个不同的颜色进行标注,这样就非常清晰了。

呼~到这里,我们就熬到最后一步了:也就是把这个Excel表扔到卫星地图里,观察最终的结果!

[ P.S. 在导入卫星地图软件之前,记得把excel表格转换成geojson的格式!]

IV. 导入卫星地图与结论

可以观察地标的卫星图有很多种,比如谷歌地图就是个很好的应用。但我们觉得谷歌地图不太好看,所以就换成了用Carto这个软件来显示。

出于一些学术考虑,我不能在这里放我们的最终工程图。但我在Carto界面找了一个比较近似的展示效果,可供参考:

图片

直接说最后的研究结论吧,我们最后得到的分析是这样的:

1. 莫迪亚诺小说中的地名,并不是凭空的引用,而是与叙述者的情感息息相关,比方说,某些街道有着固定的积极意象,而另外一些,则是一提起来,就与压抑的黑色情绪相关联。
2. 学者们所认为的“左岸是美好的,右岸是黑暗的”的说法,实际上并不准确。我们发现,左右岸其实都是消极情绪占主体,在数据上并没有哪边情绪更积极一说。
3. 综上,我们提出莫迪亚诺小说中,情感地理的“离心力”模型:越是靠近巴黎中西部的中心地带,消极情绪值越高;反之,越靠近巴黎的边缘地带,积极情绪越多。这反映出的小说里男主的“逃离心理”,与莫迪亚诺的小说主题完全吻和。
4. 我们还额外找到了德军在二战期间,在巴黎的全部驻扎点(包括盖世太保办公室、临时征用的宾馆、军事集中营、黑市买办办公室等全部机构在内),如下图:
图片
之后,我们也将这些德军的驻扎点导入了卫星地图中,再与莫迪亚诺虚构小说中的地点作比较。
最终发现,这些真实存在过的历史地点,与莫迪亚诺小说中、唤起消极情绪的地点重合度极其高——这足以证明,莫迪亚诺的小说看似落笔轻盈,实则“借今讽古”。即便书写的是战后的故事,其中的人与事,依旧被当年的犹太迫害阴影所笼罩。
最后的最后,也感谢一切能看到结尾的读者。这篇文章相比以前的写作而言,确实显得晦涩了些,但在真正的行家看来也是不值一哂,所以就权当抛砖引玉吧,希望南木的菁菁人才们也多多撰文,围绕文学开展更鲜活,更富有价值的讨论~
欢迎阅读:南木写作社简介及加入通道
图片

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多