ちょっとマニアックなRAID解説
昨日iPod shuffleでRAIDという話を書いたのですが、2つ持ってる人からコメントで「ミラーリングぢゃつまらんので却下(w」というお言葉をいただきました。
いやいや、RAIDというものはそうではないのです、と一般の人にはほとんど役に立たないRAIDの話なんかを書いてみようかと思いました。多分面白くないんでフツーの方はスルーしてください(笑)
いやいや、RAIDというものはそうではないのです、と一般の人にはほとんど役に立たないRAIDの話なんかを書いてみようかと思いました。多分面白くないんでフツーの方はスルーしてください(笑)
----
さてさて。ここまで読み進めていただいている稀有な方のためのシンプルなRAID講座の始まりでございます。
みなさんRAIDってなんだかご存知でしょうか?ってまあご存知な方はこんなところまで読まないと思います(笑)。RAIDというものは大雑把に言うと「複数台のHDDを1台のように見せかける技術」です。
しかし「RAIDにすると速い」とか「サーバーなんかで使われている」とかよく分からないモノかもしれません。最初はわけが分からないでしょうが、徐々に解説していきますね〜
さて、まずは話を単純化するためにHDDを2台にします。この2台のHDDに「ABCDEF・・・」といったようなデータを記録する場合、簡単に分けて3通りほど思いつきます。まずは一番シンプルに、片方のHDDに「ABCDEF・・・」と記録する方法です。この場合、片方のHDDにデータが溢れてしまったらもう片方のHDDに記録していくことになります。フツーです。
次にHDD1に「ABC・・・」HDD2に「DEF・・・」といったように2台のHDDに分散して記録する方法です。こうすることで負荷を分散していこうというわけですね。2人で1つの仕事をこなすようなものです。こりゃ速いですよねぇ。この考え方が「RAID0」と呼ばれるもので、通称ストライピングといいます。この方法の特徴は「HDDが多いほど高速に動作する」ということです。統率さえとれれば1人よりも2人、2人よりも3人のほうが早いですよね。「高速になるRAID」といえば通常この方法を指します。
もひとつ、HDD1に「ABCDEF・・・」、HDD2にも「ABCDEF・・・」と記録する方法です。こうすれば同じデータが2つに増えるのでデータの安全性が高まります。これが「RAID1」通称ミラーリングと呼ばれるものです。サーバーなどのデータの安全性確保のためによく用いられます。ただし2台のHDDを用意しても1台分しか見えません。容量あたりの単価として考えるとちょっと悲しくなります(笑)
ついでにもうひとつ、先のRAID0とRAID1を合わせて使う「RAID0+1」というものもあります。分かりやすく書くと、HDDを4台用意して2台を交互に書き込む高速動作用、残りの2台を先の2台のバックアップ用として利用することで信頼性と高速性を両立させようという考え方です。一番コストがかかるのもこの方法ですが(笑)
で、ここからちょっとややこしい話になってきて、RAID5というものもあるんですよ。概念的にはさっきのRAID0+1と似ているのですが、さっきは4台使ったHDDがRAID5では3台で済むようになるんです。具体的にはちょっと細かい話になりますが、下記のような感じです。
パソコンのデータは基本的に0か1になっています。これの繰り返しであらゆるデータはできています。RAID5はここまで戻ってこないと説明しづらくなっています。まず、HDD1にデータAを書き込みます。次にHDD2にデータBを書き込みます。このとき、データA/B共に0または1だとします。すると次のHDD3には「データA/Bが同じなら0、違ったら1」というような「パリティ」というものを書き込みます。パリティというのは「他の2つのデータが同じか違うか」だけを記録しています。そういう意味でデータA/Bの「0もしくは1」とは値は同じでも意味がぜんぜん違うのです。
で、ここからがすごいところなんですが、RAID5はHDDが1台壊れてもデータの復活ができるんですよ。何でかって言うと「元のデータのうちの1つとパリティがあればもうひとつのデータが何か分かるから」なんですね〜。データが2つ揃ってるときにはパリティ求めるのは簡単ですし。
詳しくは@ITが図入りで詳しいようです。
というわけで・・・結論としてはですね、2台でもストライピングできるんですよってことで(笑)
さてさて。ここまで読み進めていただいている稀有な方のためのシンプルなRAID講座の始まりでございます。
みなさんRAIDってなんだかご存知でしょうか?ってまあご存知な方はこんなところまで読まないと思います(笑)。RAIDというものは大雑把に言うと「複数台のHDDを1台のように見せかける技術」です。
しかし「RAIDにすると速い」とか「サーバーなんかで使われている」とかよく分からないモノかもしれません。最初はわけが分からないでしょうが、徐々に解説していきますね〜
さて、まずは話を単純化するためにHDDを2台にします。この2台のHDDに「ABCDEF・・・」といったようなデータを記録する場合、簡単に分けて3通りほど思いつきます。まずは一番シンプルに、片方のHDDに「ABCDEF・・・」と記録する方法です。この場合、片方のHDDにデータが溢れてしまったらもう片方のHDDに記録していくことになります。フツーです。
次にHDD1に「ABC・・・」HDD2に「DEF・・・」といったように2台のHDDに分散して記録する方法です。こうすることで負荷を分散していこうというわけですね。2人で1つの仕事をこなすようなものです。こりゃ速いですよねぇ。この考え方が「RAID0」と呼ばれるもので、通称ストライピングといいます。この方法の特徴は「HDDが多いほど高速に動作する」ということです。統率さえとれれば1人よりも2人、2人よりも3人のほうが早いですよね。「高速になるRAID」といえば通常この方法を指します。
もひとつ、HDD1に「ABCDEF・・・」、HDD2にも「ABCDEF・・・」と記録する方法です。こうすれば同じデータが2つに増えるのでデータの安全性が高まります。これが「RAID1」通称ミラーリングと呼ばれるものです。サーバーなどのデータの安全性確保のためによく用いられます。ただし2台のHDDを用意しても1台分しか見えません。容量あたりの単価として考えるとちょっと悲しくなります(笑)
ついでにもうひとつ、先のRAID0とRAID1を合わせて使う「RAID0+1」というものもあります。分かりやすく書くと、HDDを4台用意して2台を交互に書き込む高速動作用、残りの2台を先の2台のバックアップ用として利用することで信頼性と高速性を両立させようという考え方です。一番コストがかかるのもこの方法ですが(笑)
で、ここからちょっとややこしい話になってきて、RAID5というものもあるんですよ。概念的にはさっきのRAID0+1と似ているのですが、さっきは4台使ったHDDがRAID5では3台で済むようになるんです。具体的にはちょっと細かい話になりますが、下記のような感じです。
パソコンのデータは基本的に0か1になっています。これの繰り返しであらゆるデータはできています。RAID5はここまで戻ってこないと説明しづらくなっています。まず、HDD1にデータAを書き込みます。次にHDD2にデータBを書き込みます。このとき、データA/B共に0または1だとします。すると次のHDD3には「データA/Bが同じなら0、違ったら1」というような「パリティ」というものを書き込みます。パリティというのは「他の2つのデータが同じか違うか」だけを記録しています。そういう意味でデータA/Bの「0もしくは1」とは値は同じでも意味がぜんぜん違うのです。
で、ここからがすごいところなんですが、RAID5はHDDが1台壊れてもデータの復活ができるんですよ。何でかって言うと「元のデータのうちの1つとパリティがあればもうひとつのデータが何か分かるから」なんですね〜。データが2つ揃ってるときにはパリティ求めるのは簡単ですし。
詳しくは@ITが図入りで詳しいようです。
というわけで・・・結論としてはですね、2台でもストライピングできるんですよってことで(笑)
2005/02/11 Fri 22:30 | - | -