メールから始まった
(当たり前ですが)事は、突然起きました。
xxx.sakura.ne.jp Monit instance changed at xxx, 2x Jun 2011 xx:xx:xx +0900
Monit alert xxx.sakura.ne.jp at xxx, 2x Jun 2011 xx:xx:xx +0900 on xxx.sakura.ne.jp: Monit reloaded.
|
と、こんなメールが来ました。
これは、「Monitを使ってApacheを監視する(1)」で紹介したサーバー監視のmonitが動作したお知らせメールです。
このメールが来たということは、monitが(再)起動されたということですから、いやな予感です。
さくらのVPSのコントロールパネルを確認
確認のため、さくらのVPSのコントロールパネルへアクセス。
確認してみると(上図は、随分あとでハードコピーしたので、グラフ的に前になってます。)、CPUの欄で、グラフが途切れています。
おおーーーっ、更にいやな予感。
さくらのVPSのお知らせ(障害情報)を確認
続けて、お知らせ(障害情報)を確認してみました。
ガーーーンっ、
なんと、自分のさくらのVPSのサーバーIPアドレスが障害発生でリブートされた・・・とあります。
再起動の影響を確認
少し冷静さを取り戻して、サーバーチェック。
動いていないサービスが1つあったので、それを手動で起動し、再起動しても、ちゃんと起動するようにchkconfigで設定しておきました。
とりあえず、被害らしいものは、サーバーが止まっていた時間(概ね10分程度)だけだったようで、ファイルやデータベースなどは、特に問題なさそうです。とりあえず、ほっと一息です。
さくらインターネットのサポートへ確認
以前から、同じ障害で他のサーバーのリブートが発生していたということもあって、ちょっと気になってもいたので、さくらインターネットのサポートへ問い合わせてみました。
Q: 件名:障害の詳細な内容と原因について教えてください。
先日、障害に関する告知があり、VPSがリブートされました。
この障害の詳細な内容と原因について、なぜ、リブートしないといけないくなったのか、ユーザの使い方に問題があるのか、などなど、もう少し詳しい情報をご教示いただけませんでしょうか?
また、今後も頻繁にリブートせざるをえないのか・・・など、今後の対応についてもご教示ください。
A: この度はサーバに接続できなくなる障害が発生し、お客様にてご迷惑をおかけいたしましたこと、深くお詫び申し上げます。
今回の障害は、お客様がご利用の仮想サーバを収容しているホストサーバのシステム上に不具合が生じたことが原因で発生いたしました。
また、不具合の解消には、ホストサーバ自体の再起動が必要でございますため、お客様の仮想サーバも再起動を行わせていただきました。
なお、同様の不具合の発生を回避するため、現在対策に取り込んでおります。
同様の障害が短期間中に頻繁に発生することはございません。
ご安心ください。
以上、ご容赦賜りますよう、お願いいたします。
この文面からすると、
クライント側で、だれかが悪さをしたわけではないようで、あくまでもホストサーバの問題のようです。
それから、
短期間で発生することはないようで、少なくとも半年から1年ぐらいみたいです。
実際に、自分が稼動し始めて半年以上経過していましたから、そんなものだと思います。
また、対策にも取り組んでおられるようで、とりあえずは、大丈夫なのかなぁ・・・という感じでしょうか。
「ご安心ください。」
とまで言ってますからね。
今回の問い合わせは、
このサイトでもおすすめのVPSで紹介しているので、
「本当に大丈夫かな?」
なんて思って問い合わせてみました。
そんな問い合わせに対しても、それなりに真摯に対応してくれたようです。(自分のことは棚にあげて) 誤字はありましたけど
このサイトでは、もう、かれこれ、昨年の9月からですから、10ヶ月近く使ってますけど、このリブートの件以外で問題が発生したことはなかったです。
この障害以外で、最近、あるサイト(さくらのVPS利用者)へのDoSアタックで一時期回線がパンク状態になったケースもあったようです。
(自分のサイトは、全く影響なかったみたいですが・・・。)
その対応も、それほど時間もかからずに対処できています。
この種の障害は、細かく確認すれば、共用レンタルサーバーでもVPSでも案外多いものです。
結局、レンタルサーバーの良し悪しは、その対応にどれだけの時間がかかるか・・・・なんですよね。
どこかのサーバーは、まる1日以上復旧に時間がかかったことで、随分、人気にかげりがでてしまいましたね
そういう点からも、やっぱり、さくらのVPSってまだまだおすすめですかね。
追記 2011.06.29
今度は、事前通知です。
どうやら先の問題の本対処を行うのではないかと思います。
ここでは3台借りていて、その内1台は、この障害が発生し、リブートしました。
しかし、あとの2台は何事もなく今まで過ごしてきています。
そのリブートしなかったサーバーが全てリブート対応するみたいです。
とりあえず、これで、この障害は終わりかな!?・・・と思います。
追記 2011.07.07
借りている全てのさくらのVPSのリブートが終わりました。
良くも悪くもすっきりした感じがありますね。
いままで、swapが張り付いて、下がらなかったのが、きれいに掃除された感じで、メモリも ウェブサーバーを apache から nginx へ切り替えたことで随分楽になった感じがします。
512MBプランですが、なかなか今のところ快調です。
$ free
total used free shared buffers cached
Mem: 510532 502048 8484 0 44884 150992
-/+ buffers/cache: 306172 204360
Swap: 2048276 1216 2047060
|
・・・と、ほとんどスワップ領域は使っていません。キャッシュも使い出したので更にCPUにも余裕が出てきました。
やっぱり、apache worker版(スレッド版) + php モジュール版 は、メモリの管理に問題がありそうな感じが・・・。(あくまで想像ですが)
参考:
Nginxの最新版ソースから バイナリパッケージ(rpm)を作成し、インストールする
コメントを投稿 :