[所有参数列表] [增加新项目] [修改标题参数] [修改内容参数]

>>$webname
类似奇虎/大旗框架对方网页即可 内容采集 高级采集(一般不用)
是否过滤相同的标题而不采集:
(目的,防止采集重复文章)
是过滤 不过滤
如果想把图片或文件采集回来,你设置以下的完毕后,请再点击上方的[采集图片或FLASH或其他文件]进行详细设置
自定义正则语法规则:
举例比如内容的html代码如下
<tr><td>内容附注信息</td>没用信息<td>字段一</td>
没用信息
<td>字段二</td></tr><table>
那么左边输入
<tr><td>{content=*}</td>{*}<td>{posttime=NO'"<>}</td>
{*}<td>{myid2=NO'"<>}</td></tr><table>

附注相关参数变量:
{myphone=NO'"<>} 联系电话

myphone是你的字段英文名,你有其他字段,可以这样添加进去
如果想尽可能的做到绝对精确,你设置以下的完毕后,请再点击上方的[采集文章]进行采集主内容设置
文件后缀名
采集图片的话,请输入jpgjpg|gif,FLASH的话.请输入swf
文件地址开头必须有的字符
适用于哪个系统:
文章系统的话写article,其他可选参数为music,mv,photo,flash,down
留空,则为文章
文件url地址长度不能小于

文件不能小于多少字节

最好留空,极影响效率
文件URL地址必须包含有的字符

多个请换行
文件URL地址不能包含有的字符


多个请换行
文件url分隔符

一般是src=
为了更准确的话,也可以再长一点
显示不常用的高级设置(一般不用)
要替换文章中的字符:

目的,过滤不愿意看到的文字
格式为旧字符|新字符
多页处理:默认首页被替换的字符
(如留空,内容如有多页将不采集直接跳过)
比如:
第一页http://php168.com/1/index.html
第二页http://php168.com/1/index_2.htm
那么右边的表单填.html
分析规则就是对比第一页与第二页的网址从左到右哪个字符出现不同,就把之后的字符复制出来
多页处理:变动的页去替换的字符
(留空,内容如有多页将不采集直接跳过)
比如:
第一页http://php168.com/1/index.html
第二页http://php168.com/1/index_2.htm
那么右边的表单填_[page].htm
分析规则就是对比第一页与第二页的网址从左到右哪个字符出现不同,就把之后的字符复制出来,并把页码数字用[page]替换
多页时.第二页是否怪癖,
比如:
第一页http://php168.com/1/index.html
第二页http://php168.com/1/index_1.html
此时属于怪癖的,理论上应该是
第二页http://php168.com/1/index_2.html
所以右边请选择是,一般情况都是选否的
开头PHP正则程序语法

(适合处理采集比较怪僻的网站.不懂PHP程序的,请留空,否则会出现严重问题使得采集程序无法运行)
结尾PHP正则程序语法

(适合处理采集比较怪僻的网站.不懂PHP程序的,请留空,否则会出现严重问题使得采集程序无法运行)
采集文件结尾的PHP正则程序语法

(适合处理采集比较怪僻的网站.不懂PHP程序的,请留空,否则会出现严重问题使得采集程序无法运行)