ページ

2013年2月4日月曜日

バックアップジョブが失敗した時に確認する設定

バックアップジョブが失敗した時に確認する設定
・今日、職場でバックアップが失敗した。
・自宅のシステムでバックアップが失敗した。

さて、バックアップが失敗した時どうすればよいか。

まず、最初にするべきことは何か。
・失敗したバックアップのリカバリをどの優先度でリカバリする必要があるか。確認・判断。

次にするべきことは
・バックアップが失敗した、というエラーメッセージの文言や状態を確認すること。
→エラーメッセージ、エラーコードを見て調べてみれば原因がわかるかもしれないよ。

・ログを見る。Windowsであればイベントログ。Unix,Linux,Macであればsyslog
→バックアップが失敗した時間前後で何か記録されていないか。

・同じ時間に別の処理が動作していなかったか。Windowsであればタスク、Unix,Linux,Macであればcrontab ...あれ?Unixだと名前違ったっけか?

よくあるバックアップ失敗の原因
・定期リブートに引っかかっていた(バックアップジョブ中にサーバー再起動がかかった)
・バックアップ先のストレージが再起動した。
・別の処理時間にかぶった。(別の処理でキャンセルされた)
・バックアップ先のストレージの空き容量が無くなった。
・バックアップジョブのパスにファイルを置き忘れた。パスが誤っていた。
・メモリ不足
・別のプロセスがファイルを開いていた。→特定のDAEMON,サービスをバックアップ時に停止させる。
・NW帯域が別の処理で圧迫されていた。
・タイムアウト
・バックアップ前の処理があまりにも高速(低速)で終わりすぎていて連携(ロジック)が正しく動作しなかった。
・バックアップは失敗していなかった(監視プログラムの誤り。誤検知。エラーではなく警告表示など)
・以前のバックアップ失敗ログが検知されただけであった。

0 件のコメント:

コメントを投稿