本文共 2004 字,大约阅读时间需要 6 分钟。
最近重构一个Scrapy爬虫项目,需要将300个spider的调度任务在jenkins中添加。这已经超过了手动一个一个添加任务的极限,是时候要借助工具批量添加了。
Jenkins提供了一套远端访问的API,目前有3种方式:
XML
JSON with JSONP support
Python
远程API可以执行以下这些功能:
创建/复制 job
触发一个新的构建
查询Jenkins的运行状态
本文的思路是先在网页上手动创建一个Job,然后将Job的配置文件拷贝至本地,制作成模板。
模板job主要有两块内容:
1,【构建触发器】定时构建
其中HOST_TEST,PROJECT_TEST是在jenkins系统配置中设置的环境变量,目的是为了更换scrapyd服务器时更加灵活。
进入到jenkins的安装目录(默认为/var/lib/jenkins/),在/var/lib/jenkins/jobs/【采集】template目录下找到config.xml文件,拷贝至本地
false true false false false 0 12 * * * false curl ${HOST_TEST}/schedule.json -d project=${PROJECT_TEST} -d spider='tt_test_spider'
批量创建的job主要差异在spider名称和crontab定时任务的设置不同,将这两处模板化:
config.xml
该文件中有4个变量要配置:
crontab_value
spider_name
HOST_TEMPLATE
PROJECT_TEMPLATE
pip install python-jenkins
import jenkinstemplate_xml="config.xml"#与网页版Jenkins登录的账号、密码一致server = jenkins.Jenkins('http://yourip:8080/', username='admin', password='admin')job_list = { "test1_spider": "30 2 * * *", "test2_spider": "30 3 * * *", "test3_spider": "55 11,23 * * *",}classify = '采集'host = 'http://0.0.0.0:6800/'project = 'test_spider'for spider_name, crontab in job_list.items(): with open(template_xml) as f: profile = f.read() JOB_CONFIG=profile.replace("crontab_value", crontab)\ .replace("spider_name",spider_name)\ .replace("HOST_TEMPLATE", host)\ .replace("PROJECT_TEMPLATE", project) print(JOB_CONFIG[-200:]) view_name = "【{}】{}_".format(classify, type) server.create_job(view_name+name, JOB_CONFIG) # del_job=server.delete_job(view_name+name) # print(del_job)
搞定!分分钟创建了几百个job。
转载地址:http://wxexa.baihongyu.com/