揪出元凶:linux定时任务crontab居然没执行
扫描二维码
随时随地手机看文章
本文能学到
•如何判断文件差异
•cron 对任务计划文件要求
1. 背景
2. 初步排查
3. 分析
- crontab file格式不正确
- 文件系统被改写
- crontab file所属用户不合法
3.1. x11 crontab file 格式不正确
- 1.备份配置文件 cp var/spool/cron/crontabs/root var/spool/cron/crontabs/root.bak;
- 2.执行crontab -e;
- 3.cron任务计划是否被执行,需查看记录 watch -n 1 cat /var/log/message。
- 4.计算两文件md5是否一致 md5sum var/spool/cron/crontabs/root var/spool/cron/crontabs/root.bak;
证明:“crontab file 格式不正确”不是诱因。
3.2. x12 文件系统被改写
crontab -e虽然没有修改var/spool/cron/crontabs/root,但无法证明它有没有改写文件系统其他文件。于是在一块重新烧录镜像的板卡执行如下步骤排查:- 获取文件系统所有文件的MD5保存为/tmp/a.txt;
find arch bin etc home lib media opt \root sbin tmp usr var -name "*" | \xargs md5sum > /unuse/a.txt
- 执行crontab -e;
- 获取文件系统所有文件的MD5保存为/tmp/b.txt;
find arch bin etc home lib media opt \root sbin tmp usr var -name "*" | \xargs md5sum > /unuse/b.txt
- 比较a.txt和b.txt是否一致,从而证明crontab -e是否修改文件系统内容
证明:“x12 文件系统被改写”不是诱因。
3.3. x13 crontab file所属用户不合法
产品的cron是busybox的组件,源码面前无秘密。开始跟踪crond执行过程。在busybox源码的miscutils/crond.c添加若干 “printf(”LINE %d", __ LINE __);"跟踪程序运行。 cron在前台运行,执行crond -f var/spool/cron/crontabs/root; 发现947行没有被执行,且文件指针是0; 推断:var/spool/cron/crontabs/root没有被读取。 跟踪文件读取函数load_crontab发现438行的if第二个条件不满足,DEAMON_UID是0,只有当sbuf.st_uid也等于0时才能执行文件读取,实际返回1000。变量sbuf.st_uid表示文件所属用户的UID。
- •修改crontab file文件的UID和GID都是0,chown 0:0 /var/spool/cron/crontabs/root;
- •重新启动crond:crond -f var/spool/cron/crontabs/
- •10min后在/var/log/message里看到任务计划执行痕迹
Jan 10 12:00:00 (none) cron.info crond[854]: USER root pid 3506 cmd /usr/bin/compresslog.shJan 10 12:00:00 (none) cron.info crond[854]: USER root pid 3508 cmd /usr/local/bin/recode_check.shJan 10 12:10:00 (none) cron.info crond[854]: USER root pid 5007 cmd /usr/local/bin/recode_check.shJan 10 12:20:00 (none) cron.info crond[854]: USER root pid 6506 cmd /usr/local/bin/recode_check.sh结果:修改“crontab file所属用户”有效,任务计划可以正常运行。
证明:“crontab file所属用户不合法”是诱因
4. 推断过程
看到这个1000我已经觉察到问题根本原因,看我娓娓道来。 /etc/passwd记录linux用户所属UID、GID。UID=0、GID=0属于root用户。passwd有若干ID号,普通预设的用户的UID、GID在1~999,adduser创建的用户ID从1000开始,启动crond守护进程时会根据当前用名去 /var/spool/cron/crontabs/ 目录下寻找与用户名同名的文件,顺带检查该文件的所属用户UID,只有文件存在、UID相同才读取该文件。 按照设想,那么crontab -e执行后应该会修改用户所属ID,下面是实验步骤。- 再修改用户组为 1000 “chown 1000:root /var/spool/cron/crontabs/root”
- 观察crontab -e执行前后文件所属用户是否改变
- 实践和设想一致:crontab会修改文件所属用户。
5. 为什么测试阶段没发现问题
我的Linux系统开发环境普通用户编码从1000开始,为避免使用root用户误操作危害开发环境,一切文件均在普通用户环境下编辑,为有编辑权限,曾执行过 chown up /var/spool/cron/crontabs/root(不理解cron设计者为什么要去检查文件所属UID,即使当前已经是root权限),这个up就是我的用户名,up的UID=1000。 之所以在软件测试阶段未发现问题,原因在于任务计划默认10min才执行一次,为缩短测试时间而修改任务计划执行频率,提高测试效率,修改方法就是crontab -e编辑/var/spool/cron/crontabs/root。
当初只注重recode_check.sh执行的正确性。
免责声明:本文内容由21ic获得授权后发布,版权归原作者所有,本平台仅提供信息存储服务。文章仅代表作者个人观点,不代表本平台立场,如有问题,请联系我们,谢谢!