本插件使用需要一定的html、css 基础.
插件下载地址:https://wordpress.org/plugins/wp-jpost/
Table of Contents
ChangeLog
= 0.2.4(2018-01-25)
* [修正]解决可能发生的变量冲突问题。
= 0.2 (2018-01-10) =
* 界面修改。
* 添加随机插入关键词功能。
= 0.1.1 (2018-1-5) =
* [添加]去除正文中的指定标签HTML内容.
= 0.1 (2017-12-1) =
* [修正]采集页面http code从404变成200,旧版本需要更新WordPressre的rewrite规则.
操作方法:https://www.jiloc.com/43432.html
主要功能:
1、定向采集目标网站内容,并直接发布。
2、可以设置对应入库的分类。
3、可以自定义文章的标签。
4、可以自定义替换标题、文章内容。
5、自动另存为图片到本地。
6、自动删除内容中的所有链接。
7、增加模拟登陆功能。
8、可抓取内容也中的iframe内容。
插件截图如下:
如何添加采集任务?
任务名 :
命名请使用英文字母数字组合.
例:douban。
抓取目标网站域名(网址以/结束) :
这里填写目标网站首页的地址,以/结束。
例:https://www.douban.com
抓取目标网站列表页 :
列表页一般都是二级页面,是栏目的具体展示页,一般是用页内跳转的链接。
例如:https://www.douban.com/group/meituikong/
入库目标分类ID :
WordPress 后台 — 文章 — 分类目录 — 编译你想入库到的分类 — 查看浏览器地址栏的地址。
例:/wp-admin/term.php?taxonomy=category&tag_ID=38…
这里的tag_ID=38,这个38就是我们需要填写的值。
标签 :
WordPress 入库时,写入文章的标签值。多个标签请使用,分割(英文状态的逗号分隔)
例:WordPress,LaoJi,wp-jpost。
目标网站a链接元素 :
列表页中到二级目录的链接地址,同jQuery选择器方法。
分页格式 :
列表页中第二页区别列表页的地方。例:
列表页地址:https://www.douban.com/group/meituikong/
翻页后变成:https://www.douban.com/group/meituikong/discussion?start=8850
那么这里就填写:discussion?start={page}
这里的 {page} 就是翻页变化的地方。
分页最大值 :
这里填写翻页后最后的page值。例:
http://147hub.com/page/2052
这里翻页的最大值,即填写:2052
获取单页标题、目标单页获取元素 :title
内容页中标题、内容的标签值。同jQuery选择器方法。
内容搜索值 、内容替换值 :
比如标题正文中带有一些原来的字符串,我想替换成我的,或者不要了。
注意:这里如想替换成一样的值,可以直接写一个。如每个替换成不同的则需要对应填。例:
搜索值:- 摔角资料, – 赛事新闻 – 摔角网, – 赛事战报, – 摔角网
替换值:
搜索值:搜索1,搜索2,搜索3
替换值:替换1,替换2,替换3
使用示例:
任务名 :shuaijiao
抓取目标网站域名(网址以/结束) :http://www.shuaijiao.com/
抓取目标网站列表页 : http://www.shuaijiao.com/news/
入库目标分类ID :1
标签 :WWE,RAW,SmackDown
目标网站a链接元素 :div.lists6 dl.page0 dd a
分页格式 :{page}.html
分页最大值 :1522
获取单页标题 :title
目标单页获取元素 :div[class=”news_info”]
内容搜索值 :- 摔角资料, – 赛事新闻 – 摔角网, – 赛事战报, – 摔角网
内容替换值 :