分享

mathematica抓取网页

 gearss 2018-04-27
2017年08月07日 18:14:15
阅读数:400

一个简易的获取网页.nb程序

list = List[];
url = "http://blog.csdn.net/gl486546/article/category/6389727/";
catchPageElem[n_] := Block[{xml, len, d, i, temp},
  xml = Import[url <> ToString[n], "XMLObject"];
  d = Cases[xml,
    XMLElement[
      "span", {"class" -> "link_title"}, {XMLElement[
        "a", {"shape" -> "rect", 
         "href" -> 
          href_}, {title_}], __}] :> {"http://blog.csdn.net" <> href, 
      StringTrim[title]}, {0, Infinity}];
  len = Length[d];
  Do[AppendTo[list, d[[i]]], {i, 1, len}]
  ]
Do[catchPageElem[i], {i, 1, 13}];
list

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约