DEDE采集规则过滤与替换
>首页 -> 社会专题 -> 硬件网络 2011-03-06 来源: 作者: 【】 浏览:460

过滤与替换常用操作:点击“常用规则”,选择要过滤的代码段,再编辑成我们需要的。

如果会文章简单采集了,接下来就需要过滤掉采集内容中的广告和链接及其它代码。一般的写法是{dede:trim}要过滤的内容{/dede:trim}  ,举几个例子:

1,去除超链接,这种最常用。

{dede:trim replace=''}<a([^>]*)>{/dede:trim}

{dede:trim replace=''}</a>{/dede:trim}

如果填成这样,那就把链接的文本也一起去掉了

{dede:trim replace=''}<a([^>]*)>(.*)</a>{/dede:trim}

2,过滤JS调用广告,比如GG的广告,就加个这样的:

{dede:trim replace=''}<script([^>]*)>(.*)</script>{/dede:trim}

3,过滤div标签。这个很重要,如果没过滤干净则可能使发布出来的文章版面错位,目前大多数遇到采集后错位的原因在此。

{dede:trim replace=''}<div([^.]*)>{/dede:trim}

{dede:trim replace=''}</div>{/dede:trim}

有的时候也需要这样子过滤:

{dede:trim replace=''}<div 选择器>(.*)</div>{/dede:trim}

4,其它的过滤规则可以照以上规律进行推出。

5,过滤摘要和关键字使用,经常要用到。

{dede:trim replace=''}{/dede:trim}

6,简单替换。

{dede:trim replace='替换后的词语'}要替换的词语{/dede:trim}

采集的内容当然也要求搜索引擎收录,过滤和替换目的是减少重复,进行伪原创,如何具体的操作,就看个人的要求与喜好了。

您看到此篇文章时的感受是:
Tags: 责任编辑:佚名
免责申明: 除原创及很少部分因网文图片遗失而补存外,本站不存储任何有版权的内容。你看到的文章和信息及网址索引均由机器采集自互联网,由于时间不同,内容可能完全不同,请勿拿本网内容及网址索引用于交易及作为事实依据,仅限参考,不会自行判断者请勿接受本站信息,本网转载,并不意味着赞同其观点或证实其内容的真实性.如涉及版权等问题,请立即联系管理员,我们会予以更改或删除,保证您的权利.对使用本网站信息和服务所引起的后果,本网站不作任何承诺.
】【打印繁体】【投稿】【收藏】 【推荐】【举报】【评论:0条】 【关闭】 【返回顶部
微信分享二维码

打开微信扫一扫分享

上一篇织梦DedeCMS v5.5网站数据转移 下一篇DEDE软件及分类信息的采集方法
密码: (新用户注册)

最新文章

图片主题

热门文章

推荐文章

相关文章

便民服务

手机扫描

空间赞助

快速互动

论坛互动
讨论留言

有事联系

有哪个那个什么的,赶紧点这里给DOVE发消息

统计联系

MAIL:gnlt@Dovechina.com
正在线上:1

版权与建议

任何你想说的