大家好,我是教程君,本节我们来学习可视化数据提取。 我们和上节一样,打开内容采集,选择可视化提取如下: 点击通过Xpath浏览器获取,如下: 我们一般通过单项匹配就行,点击小箭头,再找到文章选择整体的一块点击一下,就会出现Xpath表达式。我们测试一下: 此时我们已经采集到了。点击确定返回: 之后对多个采集到的网址进行测试,都行得话,即可。 可视化提取操作非常的简单,但是对于站点的闭合性要求较高,想我们这次选择的光明网,它的网站有良好的闭合性,我们才能如此的顺利,而很多的网站是没有这样的条件的,不建议大家依赖这种方式。 |
|