软件的所有采集规则都是根据网页源码的前后代码截取中间部份,所以非常简单。
软件主要功能:
文章采集
分页采集
采集内容过滤超链接
自动下载帖内图片
内容关键字过滤替换
内容尾部自定义添加内容
采集规则导入,导出
支持采集使用相对链接的网站
采集回来的是HTML格式的文章,所以发布到论坛需要相关版块开启支持HTML代码。
自动登陆需要关掉验证码登陆,也可以手动到浏览器登陆一次就不需要再登陆了。文章发布的方式是采用模拟手工发布。
本次主要升级内容:
1.修正采集某些编码网站乱码问题。
2.改变列表页超链接截取方式,比之前更精准。
3.增加采集内容iframe,javascript脚本过滤(主要是为了过滤广告)
4.增加采集内容自定义。net正则表达式过滤(正则非常强大,几乎可以过滤任何自己想过滤的东西)
5.增加重置已发布文章为未发布。
6.修改论坛分页发布方式,以前发布到论坛的分页是在原来的标题后面加1,然后当主题发帖布,现在修正为分页当回复帖发布。