二日連続で心臓に悪いトラブル
昨日は学科の基幹サーバで重大案件(になりかけた)レベルのトラブルがありましたが、今度はNAL研サーバにトラブル(注1)が。昨晩の時点でリモートからのOS起動に失敗してたのですが、今日研究室に来れるという神谷さんに見てもらった所、
- rootのパスワードを求められる。入力してもループする(!?)
- OS強制終了させてから起動し直すと、不良セクタだかの自動修復に失敗して止まる(orz~)
という状況らしく「え、ひょっとしてファイルシステム復旧できないレベルで壊れた?」「今日から夏休みのはずだがもう終わったのか(注2)」「免許更新のための診断書貰いに豊崎行って、それを豊見城の病院に持っていってまた大学に戻るとか移動してばかりだな…」とかダークサイドに落ちかけてたのですが、fsckでなんとかなるんじゃねと調べてた神谷さんのSPスキル「助けてあっとん先生!」により復旧との報告。
ウォオアアアー!(大学向かうバス内のnaltoma氏)
事の顛末としては何故だかブート領域に破損があった模様で、そこをfsckしたら通ったらしい。それで通常起動できたよと。
・・・ということで終わってれば万々歳でしたが、大学ついてからログ確認した所
Oct 2 16:10:03 shark smartd[3912]: Device: /dev/sda [SAT], 1 Currently unreadable (pending) sectors
なるイヤラシイログが。いや、ちゃんとスキップできてるなら大丈夫なんだろうけど、これはHDD寿命の前兆だと捉えた方が良いよね。ということでそのつもりで確保していた外付けHDDを設置。フォーマットして現在そこにバックアップ中と。
ちゃんとファイル読めるうちに全体バックアップ取るかー。
もともとHDD2台詰んでいるサーバで、片方をバックアップ専用に使うつもりだったのだけど現サーバを構築した際に誤ってLVMやられてしまったのだよな。新サーバ構築する時は気をつけてもらおう。(学生にやってもらいます!)
P.S.
メインサーバもVMに移行するというのも手ではあるが、どうしようかな。その方が楽でもあるんだけど。問題は(あれこれバックアップ入ってるので)ディスク容量1TBは欲しいというところなんだよな。
(注1) 同室の高良研サーバもやばげらしい。何この同時多発トラブル。同じハード内でのVMとかならともかく、物理的に異なるPCなのに。祈祷パワーが足りてないか。。
(注2) 10/2(金), 10/5(月)は夏休みを取ってます。事務仕事とかに振り回されないように外で仕事するという意味ですが。その割には今日は結局まともに仕事で来てないな(遠い目) あ、豊崎で食べたゴーヤーチャンプルーは美味しい思い出になりました。僕の夏休み完。