分享

数据挖掘可以帮助找到吸毒嗑药的瘾君子?!

 好大水 2017-05-30


日前有研究表明,滥用药物会改变一个人的行为模式,而其他人可以通过他在社交媒体中的异常表现来判断他是否有此类举动。

  

“物质使用障碍(SUD)是一种因为滥用酒精、药物和烟草等物质而导致个体日常生活中临床性和功能性重大损伤的病症。”罗阿诺克弗吉尼亚康复研究中心的沃伦·比克尔(Warren Bickel)和他的几个同事正在研究这种病症。

 

图丨Warren Bickel


作为一个日渐突出的严重问题,当前大约有十分之一的美国人存在药物滥用的现象。导致美国政府每年要花超过7000多亿去解决因为滥用药物而导致的生产力损失、犯罪以及恢复治疗。因此,如果有一种可以快速确定药物滥用患者的方法,那将是重大的突破。

 

Bickel和他的同事们表示他们已经研发出了这样一种技术,它可以通过观察人们在社交网站上的信息(例如Facebook帖子)来发现患者。这项技术甚至对滥用不同物质进而影响人们在社交网站中发布信息的方式提供了新的见解。

 

 

  

这项新技术主要依靠分析来自2007年至2012年收集到的数据,这些数据是Facebook过去一项名为myPersonality项目的一部分。在这个项目注册的用户会进行各种心理测试,并对他们的测试进行反馈。多数人也同意允许将数据用于研究。

 

其中一项测试询问了超过13,000名平均年龄在23岁,有使用酒精、烟草或其它药物经历的用户。特别是,它询问了测试者使用这些物质的频率,并评估了每个测试者的使用水平。然后根据滥用药物的程度将他们分组。

  

这个数据集是很重要的。因为它作为一项真实数据,记录每个人药物使用的确切水平。

 

接下来这个团队收集了另外两个Facebook相关数据集。一个是超过15万Facebook用户发布的2200万条状态更新。另一个数据集更大:1100万Facebook用户“点赞”的数据。

 

 

最后,他们确定了这些数据集互相重叠的部分。有近1000位用户同时在所有的数据集中,1000多人同时在药物滥用和状态更新数据集,3,500人同时出现在药物滥用和点赞数据集。


这些在两个或三个数据集同时出现的用户为数据挖掘提供了丰富的选择。如果SUD患者真的具有某种独特的行为模式,那么在Facebook状态更新或者在点赞的模式中有可能发现它们。


所以Bickel和他的同事先后对状态更新数据集和点赞数据集进行文本挖掘。一旦发现任何行为模式,他们会在剩余的数据中寻找类似模式的人来测试,并看看他们是否也具有相同的药物使用水平。


结论非常有趣。这个团队表示他们的技术取得了巨大成功。 Bickel和同事们说:“我们最好的模型在预测烟草滥用方面准确率达到了86%,酒精滥用为81%,毒品滥用为84%,所有这些都显著优于现有的方法。”


这些技术还确定了滥用药物的人在社交网站上发帖常用到的许多关键词:骂人的词例如”fuck”, “shit”; 带有性的词例如”horny’, ‘sex”; 与生物过程相关的词如“blood”和”pain”。这些词与滥用烟草、酒精和药物的SUD患者呈正相关。另外,表示女性的单词例如“woman”以及”girl” 和类似”up“,”down“这种表示空间位置的介词与酒精滥用呈正相关,而带有仇恨的单词如”hate“, ”kill“和与健康有关的单词如”clinic”,“pill”则与药物滥用呈正相关。


这些数据显示两种方式的相关性。 “喜欢V字仇杀队和处刑人这类电影的人与酒精滥用正相关,而拥有一项爱好的人,比如喜欢卡通和儿童喜欢的电视节目,或是喜欢那些女孩们钟爱的电影和品牌,则与药品、酒精和烟草滥用呈负相关。


还有一些令人惊讶的相关性。比如,表示女性的单词例如“woman”以及”girl”与酒精滥用正相关,而表示男性的单词比如“man”和“boy”则与药物滥用呈负相关。这可能是因为男人更有可能使用这些关于女性的单词,而且酗酒的也通常是男性。


这是一项有趣的工作,只需看看人们的Facebook帖子和点赞的情况就可以马上识别出潜在的SUD患者。 Bickel和他的同事们说:“我们认为,社交媒体是一个很有潜力的平台。它可以用来研究SUD相关的人类行为,同样可以鼓励公众健康生活,预防滥用这类药物。


编辑:王凯立

参考网站:https://www./s/607943/how-data-mining-facebook-messages-can-reveal-substance-abusers/

 

-End-

 

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多