手机海南科技网 >建站经验

浅谈帝国cms的分页采集正则及过滤技巧

03-28 17:41 来源:本网 复制

之所以很多站长在做网站的时候,都会选择帝国CMS系统,我想其中的一个原因就是它的采集功能吧,今天我们就介绍以下帝国cms的分页采集正则及过滤技巧

从文章的源代码中获得的

第一种:

<p align='center'><b><font color='red'>[1]</font>&nbsp;<a href='/Eat/RMenu/200806/38611_2.html'>[2]</a>&nbsp;<a href='/Eat/RMenu/200806/38611_3.html'>[3]</a>&nbsp;<a href='/Eat/RMenu/200806/38611_4.html'>[4]</a>&nbsp;<a href='/Eat/RMenu/200806/38611_2.html'>下一页</a> </b></p>

编写的规则:

选全部列出式
区域正则:
<p align='center'><b><font color='red'>[!--smallpageallzz--]'>下一页
链接正则:
<a href='[!--pageallzz--]'>

 

--------------------------------------------------------------------------------


第二种

采集代码


<p align='center'><b><font color='red'>[1]</font>&nbsp;<a href='/lw/3/lw_31205_2.html'>[2]</a>&nbsp;<a href='/lw/3/lw_31205_2.html'>下一页</a> </b></p> <center>《

编写的规则:

选用上下导航式:
分页区域正则:<font color='red'>[!--smallpagezz--]下一页
分页链接正则:<a href='[!--pagezz--]'
新闻正文正则:
  src="">
</script></td>
          </tr>
        </table>[!--newstext--]</td>
    </tr>
    <tr>
      <td width=5></td>


过滤广告正则:
</p> <center>[!--ad--]</center>,</p><p align='center'>[!--ad--]</b>

例如:

 

 

--------------------------------------------------------------------------------


第三种

<p align="center"><img src="/bgy/Images_1/sy8.gif" border="0"  align="absbottom"> <FONT style="COLOR: #ff0000">【1】</font>  <a class=page href="094221656-2.html" target=_self>【2】</a>  <a class=page href="094221656-3.html" target=_self>【3】</a>  <a class=page href="094221656-4.html" target=_self>【4】</a>  <a class=page href="094221656-5.html" target=_self>【5】</a>  <a href="094221656-2.html"><img src="/gwy/Images1/xy.gif" border="0"  align="absbottom"></a></p>

编写的规则:

"全部列出"式正则设置:

                      分页区域正则(无) 
                      分页链接正则:     <a class=page href="[!--pageallzz--]" target=_self>

 

--------------------------------------------------------------------------------


第四种:

<DIV class=pageContainer> <DIV class=pager><span class="nextprev">&lt;&lt; 前一页</span><span class="current">1</span><a href="0731_3493_686224_1.shtml" title="转到第2页">2</a><a href="0731_3493_686224_2.shtml" title="转到第3页">3</a><a href="0731_3493_686224_1.shtml" class="nextprev" title="后一页">后一页 &gt;&gt;</a></DIV></DIV></DIV> 
</div>


选全部列出式

区域正则:
<DIV class=pageContainer> <DIV class=pager><span class="nextprev">[!--smallpageallzz--]" class="nextprev" title="后一页">

链接正则:
<a href="[!--pageallzz--]"

  本网声明:海南科技网建站经验登载此文仅出于信息分享,并不意味着赞同其观点或证实其描述,不承担侵权行为的连带责任。文章内容仅供参考,不构成投资建议。投资者据此操作,风险自担。版权归原作者所有,如来源标注有误、不希望本网刊载或侵权,请与我们联系,本网核实后将立即撤除。来源为本网的,未经本网书面授权,任何单位或个人不得转载、摘编和发表。

责任编辑:NO296

猜您喜欢