记一次我亲手导致的事故

18/07/24 下午,上线某系统,因为非自有系统,所以并没有自动发布,需要人工停止服务,然后上线项目。一切都和往常一样,奈何我的一次错误操作,导致系统暂停20分钟,收到了若干封报警邮件。并且还导致了线上目录错乱。

事故原因: 解压命令中的路径错误,导致项目文件被解压到了tomcat根目录下。且,在清理垃圾文件的时候,误删了tomcat的lib文件。
结果:项目目录错乱,应用服务器,暂停大约20分钟。

这是第一次导致这样的事故。当时,心跳加速,全身都在出汗。简直就是心如死灰。幸运的是,分布式项目,即使一台机器出现问题,其余的机器仍在继续运行,并未导致线上的交易出现问题。

事后认真的总结了原因,还是经验不足,且遇事不够冷静,用了自己不太习惯的命令。

写了一份简单的事故报告给了直属leader。并且,编写了上线的shell脚本命令。还是希望,自己以后能够做事之前,先预先演练几遍,能够细心耐心的去做事。

0

一个有关“记一次我亲手导致的事故”的想法

    1. 恩,后来就是把那台服务的机器停掉,然后重新清理tomcat目录,重新发布的。只是之前没遇到过这样的情况,心里很慌。

      0

发表评论

This site uses Akismet to reduce spam. Learn how your comment data is processed.