こんにちは、イルグルムのわです。

今回は弊社のインフラ基盤の設計・実装・運用を担う部隊「みらい基盤課」のチーム運営についてご紹介します。
みらい基盤課については、以下のブログもご参照ください。
「火中の栗は進んで拾う!」インフラの枠を超えた精鋭部隊・みらい基盤課をご紹介します!

 
みらい基盤課の一日は、朝のDailyミーティングのあと、「みらいをつくるぞ!おー!」の掛け声で始まります。(もともとはオフィスで円陣を組んでやっていたのですが、リモートワークでも大分板についてきました(笑))

今日はブログ用に写真をとるよ!って言ったらぎこちない感じの写真になりました(笑)

アナログ感を大切に、タスク管理はカンバンで実施

コロナ前は、物理的なホワイトボードのカンバン+付箋で運用していましたが、在宅勤務がメインになってからは、slackで日次のタスク、スプレットシートなどで課題や長期タスクを管理していました。

しかし、どうもしっくりこないなー。やっぱりアナログ感大好き。

ということで、原点回帰で、リモート下でも「Asanaでカンバン方式」+「miroでホワイトボード」というふうに、ツールで再現しながらタスク管理や振り返りなどを実施しています。

 
工夫点(途中でアップデートした点)

「今週のゴール」なるタスクグループで、その週に注力することを明確化してみました。
日々、追加タスク等が発生する中で、優先順位の指針にはなる感触です。

このゴールの達成・未達をベースにして、週始めの月曜日の振り返り会でタスク化を実施しています。
このサイクルから、レビュー会の開催やコード自動化、開発プロセスのちょっとした改善などが生まれています。

 
具体的なアクションは期限を決めて、習慣として残すものに移動。
過去の振り返りはホワイトボードよろしく、イメージで一旦残しています。(無償でmiroを使っている制限・・・)

リモート下でもツールを使ってホワイトボードでの振り返りを再現

振り返りから生まれたアクションは、ダッシュボードで見える化して、チームでの改善が進んでいることをメンバー全員で確認します。

運用開始から約1年弱で、大小59の改善アクションが実行されました。
いわゆるPDCAがどれぐらいの速度で回っているかを体感できて、気持ちも前向きになれますのでおすすめです。

振り返りから生まれたアクションの進捗状況ダッシュボード

 
課題感

各メンバーが別々のプロジェクトや運用タスクを担当しているので、スループットやベロシティといったチームの健全性や生産性を計測するのはやや難しいです。
(単一プロジェクトでは、サイズや見積りをプランニングポーカーである程度すり合わせているのでそこそこの指標にはなりますが、複数のプロジェクトを掛け持ちしているのでタスクのサイズ感は自己申告に依存します)

各人の負荷状況はまだ管理できていません。
上記の通りプロジェクト以外の個々のタスクも自己申告にはなりますが、記載するか検討中。
(スクラム的なスプリント計画を立てるもあり)
※後に親タスクへの工数記載が必須になりました。

また、個々のプロジェクトのスケジュール・WBSといった、タスクとの二重管理が面倒です。
なので、これまでredmineというツールをメインに使っていたのですが、同一ツールのAsana上で管理に変更しました。
Dailyのカンバンとプロジェクト/運用タスクを同期し、週次で全プロジェクトの想定タスクと工数の予実をダッシュボードで確認しています。

週次でのタスク予実ダッシュボード

交換留学で得た知見を運営に取り入れる

「井の中の蛙大海を知らず」
ということで、みらい基盤課では定期的に他社様とエンジニアの交換留学を実施しています。

交換留学については過去の記事もご参考ください。
イルグルム×シナジーマーケティングの社会人交換留学

 
過去に実施した、シナジーマーケティング様(以下シナマケ様)との交換留学から着想を得たアクションについて一部ご紹介します。

重大障害(トラブル)が発生した場合、再発防止のため振り返りを行いアクションを実行するというプロセスが発生します。
特にお客様にご迷惑をおかけした事例などでは、得てして当事者の人たちは責任感から「申し訳ない気持ちと不甲斐なさ」などを感じて、塞ぎこんだ気持ちになりがちです。
もちろん事の重大さを感じることは重要ですが、必要以上に塞ぎこんでいては次に向けた前向きで建設的な議論の妨げになることがあります。

 
そこで、シナマケ様で実施していた「感想戦」というものを技法として取り入れてみました。
「感想戦」とは、将棋等で対局後に開始から終局までの流れを再現しながら、その時々の局面で最善手はなんだったのかを振り返るやつです。
これを障害(トラブル)対応の振り返りに適応してみよう!というものです。

この「感想戦」を、とある機能のデータ集計遅延で、お客様にご迷惑をおかけしてしまった障害の振り返りに対して実施してみました。
従来の振り返りでは事前に、事象・原因・暫定対策・根治対策のたたき台を担当者が作り、レビューするというものでしたが、一旦時系列にトレースしながら事実ベースで関係者間での動きを全員で確認しながら議論を重ねました。

実際に実施してみて、障害等のトラブルを起こしたとき当事者は「申し訳ございませんでした…」からスタートしますが、「あの時こうしとけばよかったな」とか、「ここの調査で詰まったんだよな」、「もっと早く顧客へ連絡できたのではないか?」など、前向きに発言しているのが印象的でした。

以下はサンプルですが、下記のような障害履歴の経緯を当事者全員で詳細化していきました。

2020/12/xx 21:40頃 アラート検知
2020/12/xx 21:40頃 調査に入り遅延の場所を特定⇒A機能である
2020/12/xx 23:10頃 遅れているサーバを停止し、待機系サーバをサービスIN⇒ ×
2020/12/xx 23:20頃 原因は不明なものの環境を全て再度作り直し⇒再実行試みるも復旧せず ×
2020/12/xx 24:xx頃 別要因もあり、A機能停止になりこの問題を発生しないように対処リリース
2020/12/xx 04:xx頃 現状のログからは対象データ、起因は分からないのでログ出力を補完するリリース
2020/12/xx 06:xx頃 ログから当初の仮説である○○問題が原因の可能性が浮上
2020/12/xx 08:xx頃 対象Bデータが不正な機械アクセスであると判明
2020/12/xx 09:xx頃 対象Bデータは除外するようにして処理を再開
 ・
 ・
 ・

他にも、交換留学時に得たシステムの設計・運用を実際に取り入れています。(助かってます!)

一例ですが、運用時のデータリソースに対するエンドポイント接続時のNW機器による切り替えの容易性などはかなり参考になったので、メンテナンス時の運用設計に取り入れました。
また、データベースの冗長構成やバックアップ構成など局所的なプラクティスも、実際にサービスやプロダクトを何年も運用していると教科書以上の工夫が随所に組み込まれており、いくつか実際に取り入れています。

交換留学では、一時的にでも同じ釜の飯を食うことにより、パブリックな勉強会では得ることの出来ない濃い内容を相互に交換できたと感じています。

今回のまとめ

今回はチームの運営についてとりとめのない話をしましたが、最近はリモートワークが主流ということもあり、日々の仕事の進め方も随時チューニングしながら取り組んでいます。

楽しみつつ創意工夫を重ねるカルチャーを忘れずに、チームで今後も取り組んでいきたいと思います!

イルグルムではともに自社製品を企画・開発するエンジニアを募集しています。
ご興味をもっていただいた方は、ぜひイルグルム採用サイトよりご連絡ください。
イルグルム採用サイト
募集職種一覧