読者が寄せた“うっかりミス”対策

●手順や仕組みの見直しや改善

  • 通常は読取専用のアカウントを利用し、本番環境で何かする場合だけ別のアカウントを作る。手順書を作成する。開発者と別の人が本番環境で操作する。手続きがものすごく面倒だが、本番環境で間違って操作してしまうことは防げた。
  • なぜなぜ分析を発生系と流出系に分けて実施し、対策はかならず仕組みに落とし込む。これはメーカーではポピュラーだと思う。
  • 個人向け対策として、テスト環境と本環境が一目で判別が付くように画面背景の色を変更した。さらに組織的対策として、環境を操作する場合は必ず手順書を作成してから実施するようにした。また、これを会社でルール化した。
  • うっかりミスは必ず起きる。だからこそ、うっかりミスを拾い上げる仕組みが必要。トラブルの原因はそれがないことではないか。
  • 運用を変更し、WAN接続でFTPデータを取得できないようにした。SCPによるデータ取得のみ許容した。
  • 転記前の書類に専用シートを被せて必要項目だけを見えるような状態にした上で転記作業を行わせた。
  • プロンプト表示へマシン名に加え,場所も表示するように改善した。
  • IDやパスワードを別にできればいいが、仕組み上、難しい。できれば接続ツールの色を変えたいがツールの仕組み上、変えられない。今は、本番系に接続する端末を固定にして運用中。
  • アラームを読みやすくするよう表示を検討。
  • うっかりやミスは起こってあたりまえ、それを実際の動的な部分にまで影響させないためのテスト方式を考えておくことが解決するポイントではないか。実際に動かす前に問題が見つかる状態にする、接続先により画面の色を変える、など。
  • オペレーターに処理実行時に確認を促すシステムを追加した。ただし、オペレーターに確認する意識がないと意味のないシステムになってしまう恐れがある。
  • 手順書を分かりやすくする。
  • 開発と運用の権限管理、開発用と運用用のデータベース領域を区分してもらった。残りの対象データについてもリカバリを行った。
●自動化
  • データベース全体に影響するコマンドが発行された場合には、すぐにデータベース管理者チームに電子メールが飛ぶように設定した。
  • 入力を自動化した。紙にあった基データをExcelに移し、マクロを組んで、入力システムに自動入力させた。入力が正しく行われているかについても、入力したデータをエクスポートさせ、各項目の合計値を入力用データのExcel合計値と照合してチェックした。こうしたことで入力時間は減り、ミスも無くなった。
  • スクリプトによる自動実行に切り替えた。
  • 被害を軽減するため、ファイルを自動的にバックアップする仕組みに変更した。
  • 手動作業から自動作業へ変更する。
  • 転記をやめ、直接データを貼り付けた。
●確認強化
  • 簡単な操作だからミスはあり得ないと過信しない。手順を飛ばさないように、一作業づつチェックを忘れないようにする。一作業毎に操作画面で対象をチェックするよう手順書に記載する。
  • テストデータについて複数人でチェックする。
  • 2回ボタンを押して、かかるようにした。
  • 実行していないが、2人で確認しながらやるしかないと思う。
  • 体調不良や気持ちが焦っているなど、正常な状態を維持できない時は作業をしない。
  • 「声を出して指差し確認」を励行し、サーバのデスクトップ画面などの壁紙に「○△用サーバー」などと書いた画像を出し、視覚的に分かるようにした。また、CPU画面切替機のランプを必ず確認するように意識付けている。
  • 複数の人で確認する。
  • 入力内容の確認作業について教育した。
  • 自分以外の人にチェックしてもらう。
  • 重要なデータ操作は目視確認を徹底する。油断大敵。
  • 作業手順書の内容を見直し、作業手順を詳細化、注意事項を明記した。
  • トラブルが許されない環境であれば、事前に徹底的にレビューを行うこと、作業は複数人で行いクロスチェックをしながら進めること、作業後には作業ログなどをチェックリストを用いて確認すること、が必須。
  • オペレーションマニュアルで入力項目の確認を明示的に記載し、運用で徹底。
  • サーバーを保守するモニター上に「ログオフ時注意」とテプラを貼り、チェックする癖をつけた。
  • チェックシートによる入力内容の再チェック。オペレータの作業一覧を洗い出し、チェックシートを作成。そのシートに則って作業をするように運用を変更。
  • 実際にオペレーションをする人間と、そのオペレーションを確認するチェッカーという二人体制で必ず作業を行う。
  • 重要なコマンドを実行する際は手順書と画面を指差し確認するようにした。
  • 操作マニュアルを再整備。
  • 三重チェックする。チェックが担当とリーダーだけだったので、顧客からもチェックが入るように仕組みを変えた。
  • テストと確認の強化。テスト人数を増やし、かつ、顧客側にも納品後のシステムをチェックする人数と期間を増やしてもらった。それらチェック結果を書面にして残すようにした。
  • 集中力の持続、確認作業の徹底。
  • 作業前に別の人に確認してもらうように指導。
  • 同僚であっても、上司であっても、自分であっても可能なところまで細かく確認する。
  • サーバーの分かりやすい筐体部分に、ホスト名、機能名、担当者連絡先を書いたシールを貼った。リセット作業手順を見直した。
  • 同僚によるダブルチェック。
  • メールを送信前に見直す。送信先に会社名をつけ区別できるようにする。
  • どんなに小さい作業でも、チェックシートを作成し、作業一つひとつに確認を入れる。また、そのチェックシートを別の人に見ながら作業してもらい、正しく行えるかを確認した。
  • 必ず、チェックする。
  • コンバージョンのデータの目視確認をルール決めして徹底する。
  • チェックシートはあったが、1人で確認をしており、第三者の確認がなかったので、第三者の確認行為を追加する事とした。
  • 口頭ではなく、書面やパソコン上で再確認する
  • 該当作業に従事する全員(3シフトでの交代勤務者全員)へ事例を説明し,ルール遵守を再徹底した。
  • アプリケーション停止やサーバリブートは2人以上で確認する。ホスト名、IP、ログインユーザーのすべてを2人で確認してから、停止やリブートをする。リリース時に問題が発生すると焦ってしまうので、必ず2人がペアで作業し、相互確認する。
  • まず全員に事例を説明し、起こるはずもないことはないとを説明。レジ稼働台数を増やしたり、ベテランと新人とのペアにしたりする。ただしいつも実行できているわけではない。
  • 毎回、アドレスを確認してから送るようにした。この件に関しては 会社の上司に同じ事を伝えて日頃の常識を徹底して頂く事をお願いした。
  • データを誤入力した場合、注意喚起メッセージを画面上に表示するようにプログラムを作成。
  • オペミス防護用に、運用マニュアル(保守マニュアル)作成し、浸透化。
  • 部屋に来ている電源の系統を再確認し、社員教育を徹底。
  • アラーム検知時には読みあげを行い、在席する運用担当者で内容を確認する。一人だけで確認して終わりにしない。
  • 人の作業はベテランでもミスをする、という前提の元に、運用環境に手を入れる時は、作業者は細心の注意を払って作業すること、確認者は作業者がミスしている前提で疑って確認を行うことを周知した。
  • 作業者とは別に確認者をつける。補助する作業者がベテランの場合であっても、メインの作業者が必ず確認することにした。そうしないと、「相手がちゃんとチェックしたはず」という思い込みでミスを見落としてしまうから。そのような手順でチェック作業をすると、二人で共同作業する場合の効率は悪くなるが、やむを得ない。
●意識や気持ちの改革
  • リモートデスクトップを切断する際、最後の最後で一息ついて、リターンキーを押すこと。
  • サポートセンター関係者全員で問題事象を認識し、問題原因を特定した。手順の見直しを実施したが、本質は意識にあると判断し、関係者全員へのセキュリティ情報取扱に関する注意事項について啓蒙した。
  • 作業を「切る」ことで悪い流れを断ち切る。ある程度時間がたつと慣れにより再発する可能性があるため、適宜啓蒙活動を行う予定。 ミスによりエンドユーザーの業務へ与えた影響度を考えさせたうえ、作業者の単独ミスという見方をせず 作業指示した者、作業者、作業後のチェックと組織のエラーであることを認識させ原因究明に努めた。
●情報共有
  • ミスの原因を分析し、その情報を共有する。
  • 毎週、間違い入力の結果を関係部署に公表する。
  • どのような対応者でも確認ができるようにマニュアルを作成し、確認承認体制を整え、ミスに関する事例集を作成した。
●対策せず
  • ミスをしたチーム(3名)がプロジェクトを離れる事になっただけで、具体的な対策をしていない。
  • 本番環境を直接操作するのはやめようと心に刻んだ。つまり、気をつけるようにしただけで、システマチックな対策はしていない。 対策は行っていない。
  • 策…はあまりなかったような気がする。
  • 具体的な対策は講じていない。