搜索

分享

QQ空间 QQ好友新浪微博微信

mathematica抓取网页

gearss 2018-04-27

展开全文

2017年08月07日 18:14:15

阅读数：400

一个简易的获取网页.nb程序

list = List[];
url = "http://blog.csdn.net/gl486546/article/category/6389727/";
catchPageElem[n_] := Block[{xml, len, d, i, temp},
  xml = Import[url <> ToString[n], "XMLObject"];
  d = Cases[xml,
    XMLElement[
      "span", {"class" -> "link_title"}, {XMLElement[
        "a", {"shape" -> "rect", 
         "href" -> 
          href_}, {title_}], __}] :> {"http://blog.csdn.net" <> href, 
      StringTrim[title]}, {0, Infinity}];
  len = Length[d];
  Do[AppendTo[list, d[[i]]], {i, 1, len}]
  ]
Do[catchPageElem[i], {i, 1, 13}];
list

本站是提供个人知识管理的网络存储空间，所有内容均由用户发布，不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息，谨防诈骗。如发现有害或侵权内容，请点击一键举报。

转藏分享

QQ空间 QQ好友新浪微博微信

献花（0） +1

来自： gearss > 《Mathematica》

举报/认领

0条评论

请遵守用户评论公约

类似文章 更多

gearss

关注对话

TA的最新馆藏

[转] 庄子寓言故事（五十则）
[转] 特别关注·憨佗评《三国演义》
名言集
一只不会飞的鹦鹉（深度好文）
老鼠偷了人类的大米，人们说它狡猾；人类偷了蜜蜂的蜂蜜，却说它很勤劳
2022国际数学奥赛，中国少年全员满分摘金！那些藏在奥数背后的故事

喜欢该文的人也喜欢更多

热门阅读换一换