专注前端,专注网页设计制作 - (网页制作/模板制作/设计) QQ:755150799 织梦模板 | 网页特效 | 网站模板 | 建站教程 | TOP排行榜 | Tag标签 | 联系我们

帝国CMS采集正则介绍与写法

时间:2014-03-06来源:学技巧网站制作 作者:学技巧 阅读: 次 【 点评一下

帝国CMS的采集正则
1、作用:通过设置采集正则以便使系统识别你要采集的内容。
2、帝国CMS的采集正则是什么样的,下面我们用实例讲解:
(1)、假如我们要采集页面的内容页为如下页面:
图1:HTML页面
注意事项:上面的“识别代码头部”一定是要唯一的标记。

3、帝国CMS正则还有表示任意内容的字符:“*”
如果“识别代码头部”中有内容是变化的,那么我们可以用*代替它。如页面源代码为如下,我们要采集下面的链接地址:
<a title="任意可变内容" href="链接地址">标题</a>
通过使用“*”任意内容表示字符,我们可以用下面的正则忽略可变内容,获得链接地址:
<a title="*" href="[!--newsurl--]">
附加说明:[!--newsurl--]为页面链接地址的正则变量。
4、其他说明:
(1)、正则要找出唯一性的开头字符。有时候空格都会成为识别的依据。
(2)、对于特殊字符请在前面加上“\\”,当然直接将特殊字符改为“*”最合适了。特殊字符如下:
“ )”、“(”、“{”、“}”、“[”、“]”、“\”、“?”等等。

分享到:
  • 用微信  “扫一扫”

    将文章分享到朋友圈。

    关注公众号:xue-jiqiao

本文版权归原作者所有,转载请注明原文来源出处,学技巧网站制作感谢您的支持!