采集管理>新增采集节点:    
 网址获取 内容规则
节点基本信息
节点名称: 页面编码: GB2312 UTF8 BIG5
图片相对网址: 物理路径:
文章来源:(文档中使用) 内容匹配模式: 正则表达式 字符串
以下选项仅在开启防盗链模式才需设定,如果目标网站没有防盗链功能,请不要开启,否则会降低采集速度。
防盗链模式: 不开启 开启 资源下载超时时间:
采集列表获取规则
来源网址获取方式: 符合特定序列的列表网址 手工指定列表网址
分页变量起始值: 变量结束值: 表示 [var:分页] 的范围)
来源网址:
  对于比较规则分多页的列表网址,用 http://abc.com/list.php?page=[var:分页] 的形式,然后指定"分页变量起始值"。
列表页中文章网址的命名规则:
用正则匹配置网址: 文章网址需包含: 网址不能包含:
限定HTML范围:
(如果文章网址命名不规范,用正则的形式无法正确获得需要的网址,设置此选项来获得)
起始HTML:
结束HTML:
如果你想手工指定要采集的列表网址或除了合符规则的列表网址外,还含有其它列表网址,请在下面指定:
手工指定列表网址:
(每行一条网址,
不支持使用变量)