原文链接:http:///?p=8640数据简介 讨论你关心的事情可能很困难。网络暴力骚扰的威胁意味着许多人停止表达自己并放弃寻求不同的意见。平台努力有效地促进对话,导致许多社区限制或完全关闭用户评论。 AI团队正在研究工具,以帮助提高在线评论互动。一个重点领域是研究负面的在线行为,如有害评论(即粗鲁、不尊重或可能使某人离开讨论的评论)。到目前为止,他们已经构建了一系列可用模型。但是当前的模型仍然会出错,并且它们不允许用户选择他们感兴趣的有害评论类型,例如,某些平台可能可以接受亵渎,但不能接受其他类型的有害内容(查看文末了解数据获取方式)。 数据详情 数据格式 csv 字段 id 评论内容 有害的 严重有害的 猥亵 威胁 侮辱 身份_仇恨 大小 67191kb 样本量 159571 数据浏览 以前8行数据为例,我们来预览一下: 变量探索: 总体高频词 有害的高频词 严重有害的高频词 猥亵高频词 词云 数据获取 |
|