分享

火车头采集器第三章第3节:可视化提取

 加斗图表情包群 2020-01-21
大家好,我是教程君,本节我们来学习可视化数据提取。
我们和上节一样,打开内容采集,选择可视化提取如下:

点击通过Xpath浏览器获取,如下:

我们一般通过单项匹配就行,点击小箭头,再找到文章选择整体的一块点击一下,就会出现Xpath表达式。我们测试一下:

此时我们已经采集到了。点击确定返回:

之后对多个采集到的网址进行测试,都行得话,即可。
可视化提取操作非常的简单,但是对于站点的闭合性要求较高,想我们这次选择的光明网,它的网站有良好的闭合性,我们才能如此的顺利,而很多的网站是没有这样的条件的,不建议大家依赖这种方式。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约