草根站长成长计划:跟我学新云采集入门(2)

80酷酷网    80kuku.com

  本教程我们以天空下载站为例,简要说明下新云的采集规则,适合入门新手,高手请飘过。

其实规则并不难,自己多试试就会了。

现在请把新云后台打开,我们一起来看看采集规则是怎么写的。


首先进入新云管理系统后台,在“文章中心”找到“"这一项,选择顶部的”添加采集项目“,如果你设置了其他的栏目,

那么请选择对应的栏目进入。

这次采集我们以这个:

天空下载站这个栏目作为目标站。

项目名称:天空下载站

目标站点URL:


所属分类:选择你所要添加到的栏目。

所属专题:假如你设置了专题,也可以选择。

远程列表URL:

其他的不用管,点下一步,我们来看列表文件的采集代码:

在目标页面空白处点右键,点”查看源文件”调出列表页面的源代码,我们根据列表页面很容易看出,文章列表的开始部分就在:

<tr>
          <td valign="top">
      <table width="564" border="0" cellspacing="0"

cellpadding="0">
              <tr>


再来看获取列表结束代码:

</table>
      
            <table width="550" border="0" align="center" cellpadding="0" cellspacing="0">
              <tr>

获取连接开始代码:


<a href='

获取连接结束代码:

'><strong>

下一步,我们来看文章页面的规则。在写的过程中要注意“代码的唯一性”。



点开内容页面,同样的方法调出内容的“源文件”。

获取文章标题开始代码:因为<title></title>中间的代码比较乱,我们可以选择文章部分的TITLE,代码如下:

<td height="40" align="center" bgcolor="#F7F7F7"><strong><font size="2">


获取文章标题结束代码:</font></strong></td>

获取文章内容开始代码:

<td align="center"><table width="96%" border="0" cellspacing="0" cellpadding="0">
                    <tr>
                      <td> </td>
                    </tr>
                    <tr>
                      <td> <p>

获取文章内容结束代码:


<tr>
                      <td> </td>
                    </tr>
                  </table></td>
              </tr>
              <tr>


指定演示URL:  

下一步点演示,看看有能不能看到预览的采集效果页面。如果可以,那么恭喜你已经成功了。

我们再点采集,出现下面的信息:

恭喜您!采集项目设置全部完成。
如果要查看项目设置是否正确,请点击项目演示 。
文章标题:五一长假放歌行 百听不厌来帮您
更新时间:2007-5-1 16:48:35
文章作者:佚名
文章来源:不详
目标地址:
--------------------------------------------------------------------------------
文章内容:
--------------------------------------------------------------------------------
  天空蔚蓝,鸟语花香,空气中弥漫着初夏的味道,此刻的心情是安宁的。有音乐的陪伴,一切喧嚣都走远,都市中为你
开辟出一片静匿的空间,车水马龙也变得静悄悄,匆忙的行人也似放慢脚步。琴瑟作伴听不厌,长假放歌邀好伴。



教学到此结束,以后会陆续推出新手建站教程。

如果你想找人免费编写采集规则,请到这里留言:

欢迎大家关注: 自习室推广群:4328917为新手量身打造的草根站长交流平台!
欢迎各大媒体转载,但请保留以上版权信息。

分享到
  • 微信分享
  • 新浪微博
  • QQ好友
  • QQ空间
点击: