节点基本信息
采集项目名:
采集目标页面编码: checked value="gbk" class="radio"> GBK checked="checked" value="utf-8" class="radio"> UTF-8 checked="checked" value="big5" class="radio"> BIG5
采集方式: checked="checked" value="desc" class="radio" >倒序采集 checked="checked" value="1" class="radio" >采集完毕自动入库
采集网址
采集地址:
(如:http://www.xxx.com/lists/cate/($cate)p/($page).html,目标栏目ID、页码、关键词分别使用($cate),($page),($word)做为通配符。
页码从: 每次增加
采集地址: 网址中必须包含 网址中不得包含
获取网址: 从采集目标页面中 结束
获取分页: 从采集目标页面中 结束
文章采集规则
文章地址: ($aid)代表文章ID
文章ID:
(采自网址)
[内容] 过滤选项: 常见规则 格式:原内容[|]替换成
标题规则: [内容] 过滤选项: 常见规则 格式:原内容[|]替换成
内容规则: [内容] 过滤选项: 常见规则 格式:原内容[|]替换成
回帖: [内容] 过滤选项: 常见规则 格式:原内容[|]替换成
自定义采集字段
 字段名(英文)  字段名(中文)  内容规则  过滤规则