分享

feed43使用教程

 gjwken 2006-04-19

作者网页

很久以前就想写了,一直都没时间,现在就应 Range的要求写一下.

  Feed43是一个为没有提供rss输出的网页制作rss的在线服务.

首先是注册,然后收确认邮件,然后登陆.

先创建:creat new feed

Step 1. Specify source page address (URL)

输入你想订阅的页面,一定要是那一页,这里用绿色软件站最新更新的那一页举例.

输入http://www./Software/Latenew.html,在 Encoding输入gb2312,这要看那页面的编码.点击Reload,等待自动分析那页的源代码.

(晕:服务高峰期,暂停服务,等能用了再写下去)

(好了,3分钟过去....能用了)

接着就会看到分析好的源码

 点击查看原始尺寸

看第二步

Step 2. Define extraction rules

设置你需要看的东西.第一个要输入的是范围

"Global Search Pattern"

看一下那页面源码,我们需要的是更新的软件列表,好在源码有注解,找到了"<!--#最近更新表格开始-->"和"<!--#最近更新表格结束-->"就以这个为搜索范围,根据它的帮助知道范围的格式是这样的:

<!--#最近更新表格开始-->{%}<!--#最近更新表格结束-->

也就是在搜索范围中间用"{%}" (不包括双引号)做为通配符号,意思就是从<!--#最近更新表格开始-->到<!--#最近更新表格结束-->的意思,分析其他网页也类似这样,找到头和尾,中间用"{%}"

在下一个Item (repeatable) Search Pattern

就是设置具体你需要的东西.

我们需要的就是新的软件名称还有它的链接,还有别的描述和日期什么的,分析源码找到软件名称的地方,如: 

 <a href=‘http://www./Software/Catalog63/1640.html‘>木马克星iparmor V5.55 Build 2422 绿色特别版+整合04.05 病毒库</A>

这就是名称和链接的源码,可以在绿色软件的页面复制"木马克星"再到feed43那页ctrl+F查找"木马克星"找到上面的源码,再分析下去,每个软件的完整源码如下:

<TR onmouseover="this.style.backgroundColor=‘#FFFFD9‘;this.style.color=‘red‘" onmouseout="this.style.backgroundColor=‘‘;this.style.color=‘‘" class=Border2> <TD height=23> [<a href=‘http://www./Sorting/Catalog63/Sorting_Indate_Desc_1.html‘>病毒防治</a>] <a href=‘http://www./Software/Catalog63/1640.html‘>木马克星iparmor V5.55 Build 2422 绿色特别版+整合04.05 病毒库</A></TD>

相同的是开头的<TR onmouseover  和 结尾的  </A></TD>  这就是我们需要的.根据它的帮助,格式如下:

<TR onmouseover="this.style.backgroundColor{*}href=‘{%}‘{*}>{%}<{*}href=‘{%}‘{*}>{%}</A></TD>

(*)代表省略的东西,{%}代表需要的东西,如软件名称,地址等等,整个格式简单来说就是  头+{*}+(具体需要的东西前面一点的代码)href=‘   +     {%} (代表链接)    +   尾

可以设置多行,将你需要的东西都做成这个格式,就会有几个 {%}

我就设置了3个{%} 分别代表 软件类别地址 软件类别   软件地址  软件名称

设置好就点击Extract

在Clipped Data就可以看到搜索结果,看看是不是我们要的东西

Item 1

{%1} = http://www./Sorting/Catalog63/Sorting_Indate_Desc_1.html
{%2} = 病毒防治
{%3} = http://www./Software/Catalog63/1640.html
{%4} = 木马克星iparmor V5.55 Build 2422 绿色特别版+整合04.05 病毒库

 点击查看原始尺寸

第三部 设置这个feed的细节

Step 3. Define output format

Feed Title                 :feed 的名称 .
Feed Link                : feed对应的网页地址
Feed Description      : feed的描述

RSS item properties   输出的样式

 Item Title Template       :  名称  用{%4}代替 看第二步搜索的结果
 Item Link Template       :  地址  {%3}
 Item Content Template  :  描述  {%4}

所以在rss订阅里看的就是

木马克星iparmor V5.55 Build 2422 绿色特别版+整合04.05 病毒库
 http://www./Software/Catalog63/1640.html
木马克星iparmor V5.55 Build 2422 绿色特别版+整合04.05 病毒库

这样
还有一个选项是将所有item作一个链接输出,样子不好看,不推荐用

 点击查看原始尺寸

点击Preview看看成果吧....

不会写教程,写得很罗嗦,希望你明白,不明白可以留言,我很乐意再解释.

作者网页

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多