パスワードを忘れた? アカウント作成
104036 story
オープンソース

GNUのレポジトリ・サーバー、クラッシュ 31

ストーリー by hylom
RAIDを信じるな 部門より

flutist 曰く、

GPLソフトウェア開発のレポジトリを提供している savannah.gnu.org が先週 (5/28木)、RAID不調によりダウンした。翌金曜日には何事もなかったかのように復帰できたが、その日のうちにまたRAIDが原因でダウン。復旧を試みたところ、結局システムを再インストールせざるを得なくなり、また不調のRAIDからバックアップしていたデータも不完全で、CVS/SVN/Git/Hgの各種レポジトリは4月末のバックアップ・テープか、各プロジェクト管理者の手元のデータから復旧することになったそうだ。savannah側では5月分は失われてしまった、とのこと。そういうわけでCVSもSubversionもgitもサービスが止まっていたが、ついさっき全面復旧した (いきさつは管理者のメール参照)。

ここでお世話になっているプロジェクトは3069件。その中にはもちろんgccやglibcも含まれている。また、たとえば Lilypond は自前サーバーもあるおかげでクラッシュ後も開発版を公開できているが、GSL なんかは直撃を食らった格好だ。

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • emacsのCVS HEAD (スコア:2, 興味深い)

    by Tsukitomo (22680) on 2009年06月04日 17時59分 (#1580336) 日記

    emacsを毎日のように更新していたのですが、ある日唐突にCVSレポジトリに繋がらなくなり、困ってました。
    で、いろんな方法を模索して、gitを使ってみると、ソースは持ってこれるのに、なぜかそれがかなり古い
    日付のものだったり(これが4月分からの復旧?)して、何が起こっているのかわからない状況でした。

    サーバのほうが壊れてたのか。

    --
    Your 金銭的 potential. Our passion - Micro$oft

    Tsukitomo(月友)
  • by SteppingWind (2654) on 2009年06月04日 19時22分 (#1580404)

    FreeBSDだとCVSup [cvsup.org]を使ってマスターのレポジトリに同期させたローカルレポジトリを持つことができるので, たとえマスターレポジトリが飛んでも混乱はあるにせよ, それほど深刻なことにはならないのかと思います. こうしたレポジトリ同期サービスをやっているプロジェクトって少ないのでしょうかね?

    • by Anonymous Coward

      だからgitを使えとあれほどいったのに・・・ #hgとかでも可

    • by Anonymous Coward
      いまだに原始的なCVS使ってるプロジェクトはたしかに少ないでしょうね
      • by SteppingWind (2654) on 2009年06月05日 10時32分 (#1580743)

        逆説的には, ツールがどんなに優れていても運用を含めて十分な考慮がなされていなければシステムとしては意味が無い, というのが今回の教訓でしょうか.

        親コメント
      • by Anonymous Coward

        > いまだに原始的なCVS使ってるプロジェクトはたしかに少ないでしょうね

        FreeBSDはとっくに Subversion に移行済ですが?
        CVS使えるだけ。

        • by Anonymous Coward
          Subversion なんて持ち出されて威張られてもなぁ。今時のオープンソース開発なら分散リポジトリでしょ。
          • by Anonymous Coward

            「分散型と中央集中型のどっちのバージョン管理システムが優れているか」なんてのは、「emacsとvi」とか「GNOMEとKDE」と一緒で、宗教論争にしかならないから止めとけ。

            とりあえずFreeBSDに関して言えば、SubversionのWebインターフェースよりもCVSWeb(確かかなりカスタムしていたはず)の方が見やすかった。

            • by funya (14942) on 2009年06月06日 12時52分 (#1581472)
              分散型は、中央集中型を含んでいる。一方で、中央集中型には、今回のように、

                サーバが壊れたら、それでおしまい

              と言う致命的な欠点がある。もはや、中央集中型を使う利点は、

                まったくない

              あるとすれば、レガシーに固執している人達の自己満足と怠慢だね。
              親コメント
              • by Anonymous Coward
                > 一方で、中央集中型には、今回のように、
                > サーバが壊れたら、それでおしまい

                分散型だって壊れたらおしまいじゃん
                馬鹿じゃねーの?
            • by Anonymous Coward
              > とりあえずFreeBSDに関して言えば、SubversionのWebインターフェースよりもCVSWeb(確かかなりカスタムしていたはず)の方が見やすかった。

              今も CVSweb インタフェースは残ってますので過去形にしなくても。
              というか、そういう需要があるから残してるのではないかと。CVSup も AnonCVS もそうですが。
  • by okuji (16439) on 2009年06月05日 12時03分 (#1580807)

    5月27日のバックアップが正常だったことが判明したので。
    http://lists.gnu.org/archive/html/savannah-users/2009-06/msg00027.html [gnu.org]

  • 1ヶ月無かったことに (スコア:1, おもしろおかしい)

    by Anonymous Coward on 2009年06月04日 17時41分 (#1580314)

    バックアップは複数取るようにしてますが、1ヶ月無かった事になる事態に遭遇したらきっと真っ白になるでしょう。

    #もしそうなったら自分探しの旅にでも出ますかね
    #旅に出ます。探さないでください。
    #
    #でも最近はGPSとかで特定される人もいるんでしょうね…

    • by Anonymous Coward

      >#でも最近はGPSとかで特定される人もいるんでしょうね…
      携帯電話端末がGPS受信機付きだったとしても、
      携帯電話端末自体のの電源を切っておけばいいでしょう。自分から位置情報を通告しなければいいんです。
      GPSの仕組みを勘違いしていませんか?

      • by Anonymous Coward
        性犯罪者の中には、強制的にGPS情報を発信させられている人がいます。その人のことを言っているんでは?
  • by Anonymous Coward on 2009年06月04日 23時23分 (#1580583)

    うちの会社のシステム運営がいい加減でも、気が向いた時にしかバックアップ
    とらなくても、仕方ないよねぇ…(笑)。すみません。定期バックアップの
    スケジュールを立てます。

    (ストールマンが怒って、GNU RAIDとか作ったりしないかな?(笑))

  • by daf6172 (29675) on 2009年06月05日 2時09分 (#1580659)

    つい先日もNTTデータのブログサービスでHDD障害が発生 [srad.jp]したりと,RAIDを組んでいるにもかかわらず復旧できないといったことが多くみられますが,
    RAIDの信頼性(ストライピングを除いて)はいったいどれくらいなものなのでしょうか?
    RAID構成なら復旧できて当たり前なので,こういう「事件」だけが表に出てくるのかもしれませんが….

    • Re:RAIDの信頼性 (スコア:3, 参考になる)

      by flutist (16098) on 2009年06月05日 11時18分 (#1580775)

      個人的な経験の範囲では、RAID 5 は大きくなるとヤバい感じがします。
      たとえば 24 個の HDD で組んだ RAID 5 で、HDD が全部同じロットだったばあい、24 個中の 1 個がコケて交換、リビルドしてる間に、残りの 23 個のうちのどれかが死亡、そして RAID 全体が死亡という泣けてくる事態は容易に想像がつきます。ていうか実体験です。へたってきたディスクが 23 個もあって、リビルドみたいな高負荷がかかれば、まぁ 1 個くらい死んでも不思議はない、と思います。

      いろんなカラミで RAID 5 にせざるを得なかったのですが、素直にミラーリングとかにしとけばよかったです。

      親コメント
      • by Anonymous Coward

        ミラーリングってRAID1って意味じゃなくて、差分バックアップを定期的に
        取り続けるって意味ですよね?

        RAID1ってマスターのファイルがごっそり削除されたら、ミラーの方も一緒
        に消えちゃうんじゃないか?と前から心配だったんで…

        • by Anonymous Coward

          心配も何も、それはそもそもRAIDで何とかなる話ではありません。
          RAIDはあくまでハードウェアエラーに対応できるだけの機構です。

    • Re:RAIDの信頼性 (スコア:2, 参考になる)

      by tak_ipc (30094) on 2009年06月05日 21時25分 (#1581219)

      個人でWin2k、シリコンイメージ(ソフトRAID5のやつ)使ってます。
      250GB×4の構成で750GB、こんな程度で良かったら参考までに。

      1年ぐらい利用していて、ある日、起動時にユーティリティでエラーが上がるようになりました。
      なにぶん、個人利用なので常に代わりを用意しているわけではなかったのですが、

      ・何回かの起動に1度、特定のHDDのエラーが起きる。
      ・HDDアクセス頻度が普段と違う。
      ・RAID5は2台壊れたらもうダメぽ。

      なので、速攻で買って交換しました。
      おかげでエラーも出なくなり、そのHDDが壊れてることが立証できました。

      ただ、ユーティリティの助けがあったものの、決定打はHDDアクセス頻度であって、
      ある程度の経験が無ければやはりデータを飛ばしていたと思います。

      もしサーバ室内のサーバだったら多分気づかなかったでしょう。
      RAID5を運用するのだったら、ユーティリティの重要性が高いと思います。
      それと、出来る限りミラーリングで・・・かな。

      親コメント
    • by Anonymous Coward on 2009年06月05日 12時40分 (#1580825)

      レアケースかもしれませんが、こんなことがありました。

      RAID 1 で一方の HDD に障害発生 -> RAID コントローラのバグ(故障?) でアラート上がらず -> 気付かずに運用 -> もう一方も障害発生。

      RAID コントローラに問題があったら正直どうしようもないですね。
      バックアップが取れていたから良かった様なものの。

      バックアップ・ウィンドウとコストの関係でバックアップせず RAID のみ、みたいなシステムもありそう。
      絶対運用担当になりたくない・・・。

      親コメント
  • これを機会に、数ヶ月サボっていたsourceforge.netのsubversionのレポジトリの
    バックアップをここ [sourceforge.net]に書いてある方法を参考にして

    $ mkdir PROJECTNAME-2009-06-05
    $ cd PROJECTNAME-2009-06-05
    $ rsync -av PROJECTNAME.svn.sourceforge.net::svn/PROJECTNAME/* .

    と取りました。ディレクトリを新しく作っているのはインクリメンタルにバックアップ
    してだいじょうぶなのか不安だからです。いまのところコミッタがぼく一人なので、
    バックアップ中にコミットが入るおそれはありません。

    また、Subversionリポジトリのバックアップ方法いろいろ [hatena.ne.jp]にあるとおり
    この方法は「バックアップデータの可搬性に乏しい(アーキテクチャ依存)」そうです。
    実際、ぼくの手元のマシンは、Intelではなく、PowerPC(上のDebian GNU/Linux)です。
    バックアップデータをローカルでレポジトリとして使えるかどうか試したことがないの
    で不安です。

    あと、たまに SourceForge, Inc. (LNUX) の株価もチェックして、会社が大丈夫なこと
    を確認しています。

    みなさんはどんなふうにレポジトリのバックアップを取っていますか?

    --
    love && peace && free_software
    t-nissie
  • とりあえずSavannahはもうだめぽ。クラッカーにやられちゃった [srad.jp]前歴もあるし。SavaneはホスティングソフトウェアのSavaneも含めて使えないな。

typodupeerror

計算機科学者とは、壊れていないものを修理する人々のことである

読み込み中...