欢迎来到六久阁织梦模板网!
dedecms织梦自带采集插件详细图文教程

dedecms织梦自带采集插件详细图文教程

浏览次数: 0

作者: 六久阁织梦模板网

信息来源: 六久阁

更新日期: 2017-10-23

文章简介

看到很多网友都为织梦(DEDE CMS)的采集教程头疼,的确,官方出的教程太笼统了,什么都没说,换个网站你什么都做不了,这个教程是最详尽的教程,让你一看即会 首先我们打开织梦后台点击 采集——采集节点管理——增加新节点 这里我们以采集普通文章为例,我

  • 正文开始
  • 热门文章

看到很多网友都为织梦(DEDE CMS)的采集教程头疼,的确,官方出的教程太笼统了,什么都没说,换个网站你什么都做不了,这个教程是最详尽的教程,让你一看即会


首先我们打开织梦后台点击 采集——采集节点管理——增加新节点


 
这里我们以采集普通文章为例,我们选择普通文章,然后确定


 
我们进入了采集的设置页面,填写节点名称,就是给这个新节点取个名字,这里你可以任意填写。
然后打开你想要采集的文章列表页,这里我们以织梦官网为例http://www.dedecms.com/web-manage/jianzhanxinde/打开这个页面,右键——查看源文件
 
找到目标页面编码,就在charset后面


 
页面基本信息其他的一般就不用管了,填完了如图
 


现在我们来填写列表网址获取规则
看看文章列表第一页的地址http://www.dedecms.com/web-manage/jianzhanxinde/list_49_1.html
对比第二页的地址http://www.dedecms.com/web-manage/jianzhanxinde/list_49_2.html
我们发现了他们除了49_后面的数字不一样,其他的都一样,所以我们可以这样写
http://www.dedecms.com/web-manage/jianzhanxinde/list_49_(*).html
就是把1换成了(*) 因为这里只有2页,所以我们就填从1到2 每页递增当然是1了,2-1...是等于1吧
这里我们就填写完了 


可能大家采集的有些列表没有规则,那就只有手工指定列表网址了,如图
 


每行写一个页面地址
列表规则写完了,我们就开始写文章网址匹配规则了,回到文章列表页
右键查看源文件 找到区域开始的HTML,就是找文章列表开始的标志。


 


我们很容易的找到了如图中的“新闻列表” 。从这里开始,后面就是文章列表里
我们再找文章列表结束的HTML


 


就是这个了,一个很容易找到的标志


如果链接中含有图片: 不处理 采集为缩略图 这里根据自己的需要选择
对区域网址进行再次筛选:
(使用正则表达式) 

必须包含: (优先级高于后者)
 不能包含:


打开源文件,我们可以很清楚的看到,文章链接都是以.html结束的
所以,我们在必须包含后面填.html 如果遇到有些列表很麻烦,还可以填写后面的不能包含


 


 
我们点击保存设置进入下一步,可以看到我们获得的文章网址
看到这些就是对的了,我们保存信息进入下一步设置内容字段获取规则
我们看看文章有没有分页,随便进入一篇文章看看。。我们看到这里的文章没有分页
所以这里的我们就默认了


 


我们现在来找文章标题等等 随便进入一篇文章,右键查看源文件
看看这些 

 


依照源码填写 

 


我们再来填写文章内容的开始,结束
和上面的一样,找到开始和结束标志
开始: 

 


结束: 


 

 


你想过滤文章中的什么内容就到过滤规则里写吧,比如要过滤文章中的图片

 


选择常用规则 

 


再勾选IMG  然后确定
这样我们就把正文中的图片过滤了
设置完毕后点保存设置并预览


 


这样一个采集规则就写好了,很简单吧有些网站很难写,可要多下点功夫了哦
我们点保存并开始采集——开始采集网页 一会的功夫就采集完了


 


我们看看我们采集到的文章 


 

 


456 
看来是成功了,我们导出数据吧 


 


 
  首先选择要导入到的栏目,按“请选择”那里即可在弹出的窗口中选择你需要导入的栏目发布选项这里一般默认即可,除非你不想马上发布。每批导入默认是30条,这里修改与否都无所谓,附带选项一般选“排除重复标题”,至于自动生成HTML那个选项建议先别生成,因为我们还要去批量提取摘要和关键字。

织梦二次开发QQ群

本站客服QQ号:3149518909(点击左边QQ号交流),群号(383578617) DedeCMS织梦教程QQ群 如果您有任何织梦问题,请把问题发到群里,阁主将为您写解决教程!

转载请注明: 织梦模板 » dedecms织梦自带采集插件详细图文教程

  • 织梦dedecms手机站m目录下不生成index.html实现动态更新
    阅读
    用 织梦建站 会手机站首页不更新的苦恼,每次 PC 更新,要去删除 m 目录下的 index.html ,手机站首页才会更新,这样很麻烦,通过以下修改,让手机站首页是动态的,不生成 index.html , PC 端更新后,手机端首页自动更新。 把 \m\index.php 里面的 $row[sho...
  • 织梦Fatal error: Call to undefined function make_hash() in /dede/sys_info.php on line 201的解决方法
    阅读
    织梦系统安装好后,进入后台,出现Fatal error: Call to undefined function make_hash() in /dede/sys_info.php on line 201 一般出现这个问题是因为升级网站引起的。我们可以直接把错误提示这段代码删除或者屏蔽就行了。 打开/dede/sys_info.php,找到201...
  • 织梦dedecms提交自定义表单后发送到指定邮箱
    阅读
    网上很多教程都是用 dedecms 自带的邮件库发送邮件,而且是写死要发送的字段内容,今天我们用 phpmailer 来给站长发送自定义表单提交的数据到指定邮箱上 (QQ 邮箱, 163 邮箱都可以 ) ,不写死任何东西,有什么字段就提交发送什么字段。 操作之前,我们要先...
  • 织梦Dedecms 5.7 火车头采集免登陆发布接口适配PHP7.X插件
    阅读
    最近有粉丝说,之前用的火车头发布文章时,用免登陆接口在PHP7.0环境中显示空白,于是今天抽空更新了一下插件(话说,DedeCms早期版本无法在PHP7.X运行,用最新版的!),那么接下来的代码就是插件发布模块无须变更,只需要变更接口插件就可以了 ?php/*/////...
  • 织梦dedecms系统多城市分站功能开发思路
    阅读
    当前很多人用织梦dedecms系统建站,多城市分站对地方性长尾关键词和全国市场的推广有着很大的帮助,今天和大家分享下如何实现织梦dedecms系统多城市分站功能。 方法/步骤 织梦dede城市分站有三种方法: 第一种是建立N多个模板,有多少个城市建立多少个模板,...
  • 织梦dedecms网站添加打赏功能
    阅读
    有时我们看到别人家的织梦dedecms网站有打赏功能,是不是羡慕嫉妒恨呢?今天我来给大家讲讲织梦网站怎么添加支付宝、微信打赏功能。 二、首先登陆畅言后台(没有畅言账号的首先注册账号) 三、进入后台,找到实验室--打赏 四、设置配置信息,保存。 五、复制...
  • dedecms织梦ckplayer视频播放器插件详细安装教程
    阅读
    织梦 ckplayer 视频播放器插件安装步骤: 第一步、下载安装插件。下载地址:点击此处 将下载下来的压缩包中的相应编码的模块文件解压出来再上传到织梦程序的 data/module/ 文件夹内或者直接在后台模块管理菜单里面选择上传新模块安装即可。如下图: 1.1 )上...
  • 织梦手机站下一篇变上一篇而且还出错Request Error!
    阅读
    最新的织梦dedecms程序手机版下一篇变上一篇而且还出错Request Error!,这是因为官方写错了一个地方 打开 /include/arc.archives.class.php 找到 $mlink = view.php?aid=.$preRow[id]; 注意:这个文件里面有2个上面的代码,真正要改的是大概在 839 行 改成 $...
  • 织梦火车头采集免登陆接口采集文章后自动更新栏目、首页、文章页,实现自动化采集
    阅读
    最近用织梦dedecms程序采集文章时候,发现每次采集都要去后台更新一下文章、栏目、上下篇以及首页,操作起来真心麻烦,后面在网上收集了一些代码以及经过自己调试,发现居然可以自动更新文章页以及栏目、首页。真心爽,这样子就能稳稳的挂机采集了哈。这是免...
  • 织梦获取当前栏目id并判断使当前导航栏目高亮
    阅读
    织梦导航栏目高亮代码如下: {dede:field name=typeid runphp=yes} if(@me==8) @me=1; else @me=0; {/dede:field} 导航的写法, 比如:lia href={dede:type typeid=7}[field:typelink /]{/dede:type} {dede:field name=typeid runphp=yes} if(@me==7) @me=cl...
收藏此文 打赏本站

如本文对您有帮助,就请六久阁织梦模板网抽根烟吧!

  • 支付宝打赏
    支付宝扫描打赏
    微信打赏
    微信扫描打赏
织梦arclist标签实现分页的方法
« 上一篇 2017年10月23日
织梦删除服务器中多余的没有被调用的图片
下一篇 » 2017年10月23日

精彩评论

有问题在这里提问,阁主会为你解决!
  • 全部评论(0
    还没有评论,快来抢沙发吧!
推荐织梦插件更多
更新时间:2019-07-10

人已经看过了!

更新时间:2019-10-11

人已经看过了!

更新时间:2019-11-29

人已经看过了!

更新时间:2018-03-20

人已经看过了!

更新时间:2017-09-11

人已经看过了!

更新时间:2019-07-24

人已经看过了!