搜索

分享

QQ空间 QQ好友新浪微博微信

【原】【数据分享】维基百科Wiki负面有害评论（网络暴力）文本数据多标签分类挖掘可视化

拓端数据 2021-11-10

展开全文

原文链接：http:///?p=8640

数据简介

讨论你关心的事情可能很困难。网络暴力骚扰的威胁意味着许多人停止表达自己并放弃寻求不同的意见。平台努力有效地促进对话，导致许多社区限制或完全关闭用户评论。

AI团队正在研究工具，以帮助提高在线评论互动。一个重点领域是研究负面的在线行为，如有害评论（即粗鲁、不尊重或可能使某人离开讨论的评论）。到目前为止，他们已经构建了一系列可用模型。但是当前的模型仍然会出错，并且它们不允许用户选择他们感兴趣的有害评论类型，例如，某些平台可能可以接受亵渎，但不能接受其他类型的有害内容（查看文末了解数据获取方式)。

数据详情

数据格式

csv

字段

id

评论内容

有害的

严重有害的

猥亵

威胁

侮辱

身份_仇恨

大小

67191kb

样本量

159571

数据浏览

以前8行数据为例，我们来预览一下：

变量探索：

总体高频词

有害的高频词

严重有害的高频词

猥亵高频词

词云

数据获取

转藏分享

QQ空间 QQ好友新浪微博微信

献花（0） +1

来自：拓端数据 > 《待分类》

举报/认领

0条评论

请遵守用户评论公约

类似文章 更多

拓端数据

关注对话

TA的最新馆藏

R语言非参数方法：使用核回归平滑估计和K-NN(K近邻算法)分类预测心脏病数据
2025年电力报告60+份汇总解读|附下载
Python用Transformer、Prophet、RNN、LSTM、SARIMAX时间序列预测分析用电量、销售、交通事故数据
2025年移动游戏市场报告130+份汇总解读
2024AI智慧生活白皮书：AI智能科技重塑居家智能家居AIoH体验报告汇总解读
2025年电力报告60+份汇总解读

喜欢该文的人也喜欢更多

热门阅读换一换