头条根据关键词进行采集-火车头规则学习
头条根据关键词进行采集-火车头规则学习
今天我们讲述一下有关高铁采集器根据关键词文件对今日头条进行采集的演示。头条根据关键词进行采集,需要两个文件toutiao.php以及toutiao.txt其中*.txt文件可以根据不同的关键词创建不同的txt文件。默认使用的是toutiao.txt
火车头方面:
网址采集规则处填写:http://www.xxx.com/toutiao/toutiao.php?f=shufa,其中这里的f参数便是指定要使用哪一个文本文件,我们这里的使用的是shufa.txt文件下的关键词组。
内容采集规则界面:
按照平时的采集规则填写就好,我们这里是已经填写好的,拿到以后只需要简单修改一下就可以使用.这里对应的页面是:https://www.toutiao.com/article/7089648903900906014/?channel=&source=search_tab 这个链接的内容.
发布接口:
发布接口我们这里有pbootcms的免登陆发布接口,其他cms如果需要,可以定制。
如果需要研究此采集规则,可以联系我们获取。