采集管理>更改采集节点:    
 网址获取 内容规则
节点基本信息
>
节点名称: 页面编码: > GB2312 > UTF8 > BIG5
图片相对网址: 物理路径:
文档来源:(文档中使用) 区域匹配模式: /> 正则表达式 /> 字符串
以下选项仅在开启防盗链模式才需设定,如果目标网站没有防盗链功能,请不要开启,否则会降低采集速度。
防盗链模式: > 不开启 > 开启 资源下载超时时间:
引用网址: (需加http://)
采集列表获取规则
GetInnerText(); if(!empty($linkarea)){ $linkareas = explode('[var:区域]',$linkarea); $l1 = $linkareas[0]; if(!empty($linkareas[1])) $l2 = $linkareas[1]; } ?>
来源网址获取方式: > 符合特定序列的列表网址 > 手工指定列表网址
分页变量起始值: 变量结束值: 表示 [var:分页] 的范围)
来源网址:
  对于比较规则分多页的列表网址,用 http://abc.com/list.php?page=[var:分页] 的形式,然后指定"分页变量起始值"。
如果来源网址是列表网址,请指定下面文章内容网址获取规则的属性:
用正则匹配置网址: 文章网址需包含:  网址不能包含:
限定HTML范围:
(如果文章网址命名不规范,用正则的形式无法正确获得需要的网址,设置此选项来获得)
起始HTML:
结束HTML:
如果你想手工指定要采集的网址或除了规则网址外,还有其它网址,请在下面指定:
手工指定网址:
(每行一条网址,
不支持使用变量)