私の中で、エンジニアとして昨年2019年に異様な盛り上がりを見せたことというとQiitaのAdvent Calendarの「本番環境でやらかしちゃった人」です。
記事によってはあまりに問題となり、非公開にされるということも起きました。
社内の勉強会でも、これらの記事を読み返し、学びに活かすということをしていました。
私の中でこれらの記事を読んで得たことを一つ挙げるなら
一人で仕事をしない
でしょう。
人間、慌ててしまうと、あり得ないような間違いもしてしまいがちです。
運用ごとは、突然の依頼が来て、今すぐ!早く!となりがちです。
そういった状況ですので、トラブルが起きるのです。
社内の勉強会で、私もやらかし話を発表しました。
相当慌てていたので、例によって当たり前のようなことが当たり前に出来ず、イージーミスだらけでした。
しかし、やらかしと言っても、データを全て削除したわけでもなく、結果として、事なきを得たため、
これってやらかしと言えるのか?
と事前に気づき、大した事ないって言われるかもなーと思ってたのですが、
「これでうまくいったのが奇跡」
「最悪、サーバークラッシュしていた」
「上手くいって、おめでとう」
など、散々な反応でした。
一つだけ、上手くいった点を挙げるとするならば、わかる人を一人置いておいた事でしょう。
その人には実作業は割り当てず、なにかあったらフォローしてくれとお願いしてました。
これが、Qiitaのやらかし記事からの学びに来ています。
やってみて失敗しないと経験が積めないし、育たない。それでも失敗は許されない。
というわけで、わかる人を置いて、フォローしてもらうというのが狙いでした。
結果、その人に頼りきりでしたが。
こうなったのは、敵を読み違えていたことでしょう。
大した作業ではないと高を括っていたのですが、全然自分では出来なかったのです。
最近は、こうした「予備軍」とも言えるわかる人を確保しておくことは、私は好んでやっています。
こうしておけば、想定外のことに対処しやすいためです。
名将ハンニバルが、予備軍を上手く使ってローマ軍を奇襲して追い込んでいることから、私は予備軍と(心の中で)呼んでいます。
自社の人が良い人が多いので、頼むと手伝ってもらえることが多いので、この手が取りやすい背景があります。
前職だったら、望めない手段です。
2018年にも、やらかしカレンダーはあった
実は2018年のAdvent Calendarにも、やらかしのカレンダーはあったのですが、あまり記事が集まらなかったために盛り上がらなかったようですね。
やらかし Advent Calendar 2018 - Qiita
やはり、盛り上がるには人が集まることって大事なんですね。
デブサミ2020の運用体制
思い出すのが、デブサミ2020の「【14-B-5】グランブルーファンタジーを支えるサーバーサイドの技術」の発表です。
古戦場というイベントにより、サーバー負荷が高くなるのに備えるのに運用体制として以下を上げています。
- 万全の準備
- 見守り(サーバーの負荷状況を確認)
- トラブル対応
このどれも欠けてはならないと言います。