感谢每天进步网帮助写了此篇教程,原文地址:http://meitianjinbu.cn/zblog-caiji.html
1、缩略图唯一标识
这个选项要看你主题是否带这个缩略图的输入框
如果有看ID
2、图片处理
建议测试的时候不要设为本地化也不要保存到数据库
实际用的时候就要开启本地化和保存到数据库,防止图片盗链和文章删除图片就找不到了,另外只有开启保存到数据库,在附件管理才会看到图片
3、图片开启水印
这个可以根据自己的需要去下载相应的插件(这两个插件都是免费的)
4、添加网址规则
名称就是网站的名称,随便起自己知道就行
以采集创业邦的一篇文章(http://www.cyzone.cn/a/20180731/337483.html)为例
URL处就直接写 www.cyzone.cn
标题和正文的获取方式是通过浏览器的右键审查元素
关于标签和正则的区别在于(以上面的标题为例)
标签就是.article-tit,正则基本上用不到,并且比较难懂,如果你需要可以联系我
标签比正则简单好看
这两个没有说谁更准确,灵活运用,我一般用标签比较多
测试一下:
将需要采集的网站对应的网址填进去,点击获取标题和正文就自动获取了
5、域名冲突问题解决
比如新浪博客的这俩个域名:http://blog.sina.com.cn/s/blog_75a2523b0102yjne.html 和 http://blog.sina.com.cn/s/blog_75a2523b0102wyeo.html
虽然这两个域名一样,但是样式不一样,针对这种情况,就需要使用“,”将两种不同的规则分开
6、其他网站采集规则
百度百科里面的百科ta说
百家号
新浪博客
大家可以自己去写规则,在下一个版本中会增加导入导出规则,共享规则
有任何使用问题还可以联系我的QQ:841217204