ファイルサーバ導入の際、絶対に設定しておくべき機能

要約
・RAIDだからって安心してはいけません。普通に壊れます。RAID−Zも同じ。
・ファイルサーバにはHDDの障害検知と通知の仕組みの設定が絶対にいる。
・バックアップも必須です。
・データ復旧はかなり良い値段します。今回は3桁万円の見積でした。
環境:
FreeNas9.2.18
RAID0+1(WD 2T *4)
どうも。トクハラです。
いや〜。いきなりため息ついて良いですか。
簡単に言うと、この夏はほぼRAID祭りでした。
とあるお客さまのところで、「今朝からなんか共有フォルダが見えないんですけど・・・」
という連絡を頂いて駆けつけたところ、workgroupに本来見えるはずのファイルサーバが見つからない。
電源は入っているし、PINGも返ってくる。
コンソールを見ると、なにやら大量のログを吐き続けている。
とりあえず再起動してみると、すでにHDDの2本目がBIOS上から見えない。
この時点で嫌な汗が・・・。
コンソールのエラーはセクタ読み取りに失敗して出ているらしい。
zpool importしてもエラーを吐くばかり。
ということは1本目と2本目が同時死亡!
聞くと、どうも2、3日前からファイル書き込みがえらい遅いなと思ってたらしい。
その時点でデグレードモードになってたんだろうと思う。
この時点でディスクを交換していれば助かっていたのにと思うと、もうやるせないです。
業務への多大なる影響とか考えると、なんとか救出しなくては。
私がチクチク触っても影響が大きくなるだけと思い、とあるデータ復旧サービスへ出しました。
こっから先はあまりに言いたいことがあふれるので省略します。
簡単に言うと、2社にお願いしましたが、1社目は、かなり怪しかったです。
特に他社さまの業務に口を出すつもりもないので名前は出しませんが、今まさにどこに出そうかと悩んでいる方はメールください。
怪しいという根拠は以下のとおり。
・到着後、すぐに見積が出る。中を見てないんじゃないのかと思うくらい。
・障害当時のシステム構成を聞くといいながら、予算のmaxを異様に聞きたがる。
正当な価格であれば別に値切りるつもりもないですが、できるかぎりふんだくろうという姿勢があまりに出過ぎてると正直ひきます。
・専門家だ、プロだということでしたが、HDDの並び順がゼロオリジンであるということを知らない。
その担当者の人だけかもしれませんが・・・。
・見積後、すぐに回答をもらわないと今まさにデータが消えつつあるというような口ぶり。何故?と思いました。セクタ異常のことを言っているのであれば電源落としてよ。
・ファイルシステムはzfsでraid-0+1で組んでますと伝えると、ZFSではなくNFSですよねと返される・・・。
あ、簡単に書こうとしたのにだいぶ書いてしまった。いかんね。修行が足りんね。
で、2社目にお願いをしたら、調査に1週間くらいかかってました。
そこはきちんとバックアップをとってから作業してくれてるし、調査結果も信頼出来るものでした。
残念ながら費用感がマッチしなかったので依頼しませんでしたが、何百万払ってでも復旧しないといけないのであればみんな普通に払うんだろうね。
最後に、みんな、RAIDだからって安心したらいけないよ。
買おうとしている商品名+RAID崩壊で引くといっぱいデータ復旧業社のサイトがひっかかるはず。
必ずデグレードモードになったらメールが飛ぶとか警告ランプが着くNASを買ってください。
ほとんどのメーカのNASにはあるので、必ず設定してください。
でもあれだけ検索に引っかかるということは、みんな設定せずに死んでるんだろうね。
あと、バックアップ用のHDDとUPSもセットで買って欲しい。
全部合わせても10万、高くても20万です。
ここでケチるとあとで何十倍・何百倍のコストを負担することになります。
中小の業務の合間にシス管をやってる方、忙しい中大変だとご察しします。
が、くれぐれも「安物買いのデータ失い」にならないように。
あなたのせいにされてしまいますよ・・・。
補足
このサーバがですね、別件でお客さまのところに行ってたときに、ファイルサーバをうんうん唸りながらcentOSで構築してたので、チャチャッとUSBでFreeNAS入れてCIFSの設定だけして、日次でバックアップとっといてねという感じでサービスで作ったやつなんです。
やっぱり悪いのは私です。
サービスですとかといってお客さまに良い顔したのが致命的にダメ。
きちんと費用を頂いてキッティングと保守をしないと、かえって不誠実なことになると反省しきりです。
本当に申し訳ありませんでした・・・。