易读小说网:采集规则七:河溪小说网 www.518cqdl.com 适用于-易读系统小说站河溪小说网的采集规则 2024-04-04 05:51:43 0 0 有朋友说不会替换和查找过滤,那我就一个一个站弄下吧。没多少时间,一天发一个吧,这次是雯雯文学。 首先要过滤掉他网站的广告。过滤信息在 <PubContentText>这。可以参考下。也许还有我不知道的广告,你们可以进他的网站内页多点一下找一下看看。www.518cqdl.com 这个规则易读的采集器是可以适应的。关关不知道是否可以用。 <?xml version="1.0" encoding="UTF-8"?> <RuleConfigInfo xmlns:xsi="https://www.w3.org/2001/XMLSchema-instance" xmlns:xsd="https://www.w3.org/2001/XMLSchema"> <NovelIntro> <RegexName>NovelIntro</RegexName> <Pattern><meta property="og:description" content="((.|\n)*?)"/></Pattern> <Method/> <FilterPattern/> <Options/> </NovelIntro> <PubContentText> <RegexName>PubContentText</RegexName> <Pattern><div id="content">((.|\n)*?)</div></Pattern> <Method/> <FilterPattern>河溪小说 手机站-m.518cqd.com www.518cqdL.com m.518cqdL.com <script.+?</script>|<div.+?>|</div>|<p>|</p> 【<b>(.|\n)*?</B>】♂</FilterPattern> <Options/> </PubContentText> <NovelSearchUrl> <RegexName>NovelSearchUrl</RegexName> <Pattern/> <Method/> <FilterPattern/> <Options/> </NovelSearchUrl> <NovelList_GetNovelKey> <RegexName>NovelList_GetNovelKey</RegexName> <Pattern><span class="s2"><a href="/info/.+?/(.+?).html">.+?</a></Pattern> <Method/> <FilterPattern/> <Options/> </NovelList_GetNovelKey> <NovelListUrl> <RegexName>NovelListUrl</RegexName> <Pattern>https://www.518c 收藏(0)