分享

在线词频、语义、情感分析工具

 cloudleo 2018-01-08

根据之前在@数据化管理 微博那里看到的一些在线效率工具,来试用一下。首先就从在线词频、语义、情感分析工具开始吧。@数据化管理 推荐了三个网站,分别是图悦、大数据搜索与挖掘平台和腾讯文智。以新浪微博“英国公投决定脱欧 新浪正实时解读”的直播页面为试用对象,地址为http://live.sina.com.cn/zt/l/v/news/ygtogt2016/

①图悦:http://www./

初始页面背景是黑色的,看着不舒服,页面换肤后变成白底还可以接受。

左边文本栏可输入待分析的文本,也可以直接复制链接,很人性化。贴入要分析的网页地址,点击分析出图,右边就获得了分析结果。、

结果显示有多种模式,下面截图显示的是默认的热词权重图-标准模式。热词词频图是每个热词后面带括号显示词频,比较乱,不好看。微信模式是圆形的显示框变成扁椭圆式,地图模式是显示框为中国地图的轮廓。可以导出EXCEL,列明分析出来的关键词、词频和权重。

  

②大数据搜索与挖掘平台:http://ictclas./nlpir/

看上去功能比较强大,同样可以输入网页URL进行文本抓取。分析结果分为多个板块:

分词标注:可以对词语的词性进行分类分析,发现新词

实体抽取:对文本的实体类型和实体内容进行分析,下图是图表效果,●代表实体类型,●代表实体内容。另外还有文本效果,内容是一样的,效果不如这个好看,就不截图了。

词频统计:按照名词、动词、形容词分类显示词频,有柱状图和折线图两类图表,鼠标停留在某个词上会显示词频数量。

文本分类:似乎是对文本所讨论的问题进行归类,猜哒。

情感分析:不太明确是啥意思 --,什么叫正面,什么又叫负面呢,特定人物又是谁?

 

关键词提取:有两种模式,一是图表,二是文本。图表是个动态图,鼠标放上去的时候会不停的转动,所以看到的文字大小不代表权重。

Word2vec:似乎是分析词的相关性的,有两种模式,一是力导向布局图,二是和弦图

依存文法:看不懂简繁转换:不解释自动注音:不解释

摘要提取:所分析的网页本身就有事件简介,所以看不出太多,下文中到“脱欧派取得胜利”是原来的简介,后面两句是根据后续的消息自己补上的??

英国公投决定脱欧新浪正实时解读_直播_新闻中心_新浪网时间:2016062211:26直播已进行3小时12分简介自1973年加入欧盟前身欧共体后,英国姓“欧”已43年,624日,英国全民公投,根据投票结果,脱欧派取得胜利。目前请愿签名已快接近100万。有日本媒体称,日方担心英国离开了欧盟将向中国靠近,这会给日本带来压力。

③腾讯文智:http://nlp.qq.com/semantic.cgi

看起来是个试用版,只是提供产品体验的。分为词法类分析、句法类分析、篇章类分析、下载类分析。

词法类分析--分析结果就是把句子拆解成词语进行词性标注。

句法类分析--对句子的词性分析基础上,继续分析主谓宾定状补的句子结构。

篇章类分析--有内容分类、情感分析、关键字分析。下图是对上面那段摘要提取的分析。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多