很久以前就想写了,一直都没时间,现在就应 Range的要求写一下. Feed43是一个为没有提供rss输出的网页制作rss的在线服务. 首先是注册,然后收确认邮件,然后登陆. 先创建:creat new feed Step 1. Specify source page address (URL)输入你想订阅的页面,一定要是那一页,这里用绿色软件站最新更新的那一页举例. 输入http://www./Software/Latenew.html,在 Encoding输入gb2312,这要看那页面的编码.点击Reload,等待自动分析那页的源代码. (晕:服务高峰期,暂停服务,等能用了再写下去) (好了,3分钟过去....能用了) 接着就会看到分析好的源码 看第二步 Step 2. Define extraction rules设置你需要看的东西.第一个要输入的是范围 "Global Search Pattern" 看一下那页面源码,我们需要的是更新的软件列表,好在源码有注解,找到了"<!--#最近更新表格开始-->"和"<!--#最近更新表格结束-->"就以这个为搜索范围,根据它的帮助知道范围的格式是这样的: <!--#最近更新表格开始-->{%}<!--#最近更新表格结束--> 也就是在搜索范围中间用"{%}" (不包括双引号)做为通配符号,意思就是从<!--#最近更新表格开始-->到<!--#最近更新表格结束-->的意思,分析其他网页也类似这样,找到头和尾,中间用"{%}" 在下一个Item (repeatable) Search Pattern 就是设置具体你需要的东西. 我们需要的就是新的软件名称还有它的链接,还有别的描述和日期什么的,分析源码找到软件名称的地方,如: <a href=‘http://www./Software/Catalog63/1640.html‘>木马克星iparmor V5.55 Build 2422 绿色特别版+整合04.05 病毒库</A> 这就是名称和链接的源码,可以在绿色软件的页面复制"木马克星"再到feed43那页ctrl+F查找"木马克星"找到上面的源码,再分析下去,每个软件的完整源码如下: <TR onmouseover="this.style.backgroundColor=‘#FFFFD9‘;this.style.color=‘red‘" onmouseout="this.style.backgroundColor=‘‘;this.style.color=‘‘" class=Border2> <TD height=23> [<a href=‘http://www./Sorting/Catalog63/Sorting_Indate_Desc_1.html‘>病毒防治</a>] <a href=‘http://www./Software/Catalog63/1640.html‘>木马克星iparmor V5.55 Build 2422 绿色特别版+整合04.05 病毒库</A></TD> 相同的是开头的<TR onmouseover 和 结尾的 </A></TD> 这就是我们需要的.根据它的帮助,格式如下: <TR onmouseover="this.style.backgroundColor{*}href=‘{%}‘{*}>{%}<{*}href=‘{%}‘{*}>{%}</A></TD> (*)代表省略的东西,{%}代表需要的东西,如软件名称,地址等等,整个格式简单来说就是 头+{*}+(具体需要的东西前面一点的代码)href=‘ + {%} (代表链接) + 尾 可以设置多行,将你需要的东西都做成这个格式,就会有几个 {%} 我就设置了3个{%} 分别代表 软件类别地址 软件类别 软件地址 软件名称 设置好就点击Extract 在Clipped Data就可以看到搜索结果,看看是不是我们要的东西 Item 1第三部 设置这个feed的细节 Step 3. Define output formatFeed Title :feed 的名称 . RSS item properties 输出的样式 Item Title Template : 名称 用{%4}代替 看第二步搜索的结果 所以在rss订阅里看的就是 木马克星iparmor V5.55 Build 2422 绿色特别版+整合04.05 病毒库 这样 点击Preview看看成果吧.... 不会写教程,写得很罗嗦,希望你明白,不明白可以留言,我很乐意再解释. |
|