节点基本信息
采集项目名:
所属任务组: {$node[input_group]}
发布模型: {$node[input_postid]}
采集目标页面编码: {$node[input_sourcecharset]}
网址采集 1}style="display:none"{/if} >
网址类型: 序列网址 多个网页 单一网页 RSS
网址配置: 这是内容页
(如:http://www.xxx.com/lists/cate/[catid]/page/[page].html,目标栏目ID、页码、关键词分别使用[catid],[page],[keyword]做为通配符。
页码从: 每次增加
网址配置:
每行一条
网址配置:
网址配置:
网址配置: 网址中必须包含 网址中不得包含
Base配置:
如果目标网站配置了Base请设置。
获取网址: 结束
文章采集规则
内容页配置: 页面中必须包含 页面中不得包含 多个请用[|]隔开
文章ID:
(采自文章网址)
[内容] 过滤选项: 常见规则
标题规则: [内容] 过滤选项: 常见规则
内容规则: [内容] 过滤选项: 常见规则
回帖: [内容] 过滤选项: 常见规则
内容分页规则
分页模式: 无分页 全部列出模式 上下页模式 总页数模式
下一页规则:
请填写下一页超链接中间的代码。如:下一页,他的"下一页规则"为"下一页"。
分页URL规则:
[aid]代表文章ID,[page]代表页数
总页数获取规则:
[内容]代表总页数
匹配规则:
自定义采集字段 {php $n=0;} {loop $newfield $new} {php $n++} {/loop}
规则名: 规则英文名:
匹配规则:
使用"[内容]"作为通配符
过滤选项: