配色: 字号:
新浪微博内容及评论关键词采集
2018-04-23 | 阅:  转:  |  分享 
  
头号玩家微博评论十大热词以前看3D片,感觉就只是画面立体了一点,分明知道这是在看电影。可是看完《头号玩家》,直到眼镜去下来的那一刻,清场的人
等在座位边,我才恍然觉得回到了现实。我不是任何游戏的玩家,唯一在玩的称得上游戏的东西是王者荣耀,这电影里的游戏梗我基本都不懂,电影
的重头戏又是《闪灵》,就那几个镜头,我也是指缝里看完的。可以说是十分不解风情了。但我还是被爽到了,就像,就像大汗淋漓之后喝到了第一
口冰可乐,就像俄罗斯方块终于等来了那一根竖条……于是我就默默潜水到微博上来看看大家对头号玩家的评论,果然,一片热血沸腾!斯皮尔伯格
不愧他“爆米花精”的身份,论商业片少有人能及。但是作为一个敬业的新媒体小编,就连看部电影我都在想着下一期要写什么,相逢不如偶遇,既
然碰上头号玩家这么个有情怀有“彩蛋”的电影,不蹭个话题那像话吗?今天我们就来看看微博上看过头号玩家的观众们对头号玩家印象最深刻的十
个印象词是什么吧!编写脚本思路:使用火车浏览器脚本采集新浪微博内容以及评论高频词,首先我们一定要在脚本中添加微博的用户名密码这样脚
本才能正常运行,变量如下图添加。并且将分词插件添加在plugins目录下下面介绍下脚本的基本编写思路:(1)打开新浪微博用元素写值
加点击操作进入登入后界面(2)用打开网页操作打开需要分析高频词的页面:用浏览器操作允许新建标签页,这样点击评论页时,才能将
评论页弹出一个新的标签页,保留主页面不被覆盖(3)建立一个循环用来点击下一页..提取当前页的页面每一行的内容信息再建立一个循环
将内容信息进行处理,得到发表的内容,以及点击评论选项,获得评论的内容(4)通过对网站的分析评论有三种情况无评论评论少无需点入详
情页去采集评论评论多需要点入详情页采集评论所以要写多个判断来应对不同的情况先提取评论数量看有无评论然后再变量比较看是否有更多
评论有则用标签页进去详情页提取评论具体操作可以参考附件中的脚本之后把提取的评论和内容用变量转化功能附加到一个文本变量里面之
后引用插件来实现中文分词功能之后再把最终结果保存到文本最终得到备注:采集微博需要输入用户名和密码在关于xpath的写法先学习h
ttp://bbs.locoyposter.com/forum.php?mod=viewthread&tid=541&highli
ght=xpath。停,停,停这不是一篇简单滴教程。别光顾着学习火车浏览器的操作,看电影才是正事......这部电影里最令人惊喜的
恐怕就是各式各样的彩蛋了,当然,一般电影中的彩蛋作为能让观众会心一笑的小亮点,并不能让观众包括我在内在走出影院后一脸的意犹未尽,手
舞足蹈。但据网友们的不完全统计,在《头号玩家》这部电影中出现游戏相关的彩蛋达到了惊人的400多个!在最后的这场“昆仑决战”中,每一
个镜头都有着不同的游戏角色出现。整场决战在吾等游戏宅的眼里已经变成了知识竞答,在宏大的bgm下,每一帧小采都在想,卧槽!这个好眼熟
!卧槽!这个我也见过!卧槽!刚那个是谁??!还没有看完整部电影,我就产生了二刷的想法。而亚洲观众最大的燃点,元祖高达的出现!瞬间让
半个电影院沸腾!日本配角小哥!哇勒哇勒哇!刚大木kido!!果不其然,不出意料的高达这个词也占据了微博评论十大高频词之一,这点小采
不用采集都能猜到。游戏虽然可以让人产生不同的情感,网恋虽然也可以走到一起。但,最美好的东西还是我们的现实。斯皮尔伯格在末尾将整部影
片回归到了普世价值观,小采猜测这也是不玩游戏的导演真正想要表达的东西。很庆幸的是微博下面的评论也证明了大家对游戏与现实的问题进行了
深刻的思考。大家看电影要记得找剧情里的400个鸡蛋,观影结束记得给72岁的斯皮尔伯格导演起立鼓掌,更重要的是,记得在大师级科幻电影
里找到关于大数据科技忠告。《头号玩家》营造的虚拟世界和真实世界边界模糊,无限连接。用户数据资产在虚拟世界真实的映射,一个逼真到毛发
的影像。搜索又能让你无处藏身……说的再多也谈不及这部电影对于吾等游戏宅们的震撼程度。游戏作为一种亚文化,幸甚有斯皮尔伯格这样的导演
能给出一个让我们坐在电影院的答案,也幸甚有如此之多的厂商将他们的角色放进另一个世界。小道消息,最后一幕场景的铁巨人大战机械哥斯拉,
本来好像是奥特曼的,可惜圆古没放版权.......哈哈哈,今天的文章就到这里了,大家也可以学习一下火车浏览器的操作,自己去采集一下自己感兴趣的话题的评论,看看网友们都是怎么看待自己喜欢的作品的。君问归期未有期,我们下个星期再会!
献花(0)
+1
(本文系大海洋数据首藏)