Kzemi講座10:ファイル管理のByteの説明

いよいよ、ファイルの管理の勉強を始めます。

まず、ドライブとかフォルダとかファイルの大きさ(容量)を表す単位に「Byte」(バイト)と言う言葉があります。これは、「私のパソコンのハードディスクは40ギガバイトです。」などと言うように非常によく使われます。

パソコンは頭が良いか?
いえいえ、パソコンは0と1しか分らない単細胞です。この0と1は、「電気が流れていない」か「電気が流れている」かの事です。少し意味が違うのですが「これがデジタルです」と言うと理解し易いですか?

この最小単位を「bit」(ビット)と言います。
電気は眼に見えたり手で触れたり出来ないので、同じ原理の「点字」で説明する事にします。

点字は、「点がない」か「点がある」で情報を判断しています。これは、コンピューターの0と1と同じです。つまり、「点が無い」時は0、「点がある」時は1です。点字の最小単位も「bit」です。この点字のビットで50音を区別するためには、ただ1列に点を打っても駄目ですね。そこで、6個の点を一まとめにして、1番目のところに点がある場合は「あ」1番目と2番目の所に「点」がある場合は「い」とします。6個の点の何処かに「点」を打つ事、つまり1にすることによって50音の文字の情報が識別出来ます。

では、この6個の点でどれだけの情報が区別出来るかといいますと、2の6乗、つまり64個の情報が区別出来ます。この6個の点をまとめた、つまり6bitの単位を「1Byte」(1バイト)と言います。

パソコンに話を戻しますと、「電気が流れている」と「電気が流れていない」の最小単位のビットを8つまとめて、つまり8bitを一まとめにしたのがパソコンの「1Byte」(1バイト)です。このパソコンの1Byte、つまり8bitでどのくらいの情報が識別できるかと言いますと、点字と同じように考えて、2の8乗、つまり256の情報が区別出来ます。

では、何故この「Byte」がファイルの大きさやハードディスクの容量の単位になるかを説明します。ファイルには、文字の情報だけで無く、画像や音声のファイルもありますが、ここでは文字のファイルだけを取って説明します。

また点字で説明します。
点字の6点では、64個の情報が識別出来ると書きましたがこれはどうゆう事かと言いますと…。
いま、日本語の清音は51文字あります。6ビットの点では64個の情報が識別できましたのでこの51文字は区別して書けます。ところが、これに濁音とか拗音などを加えてしまいますと、識別出来る64個を越えてしまいます。点の打つ位置をどう変えて見ても64では識別出来る数が足りません。そこで、濁音とか拗音を書くときには6点の枡をもう一つ使って2Byteにします、つまり12個の点を使います。

では、12bitにするとどのくらいの情報が識別出来るかと言いますと、2の12乗、つまり4096の情報が識別出来ます。これだけあれば、濁音や拗音が入って来ても大丈夫です。

パソコンに話を戻しますと、、パソコンで使う日本語の文字の数は、平仮名、カタカナ、漢字、数字、アルファベット、記号などで約7000個あります。これは、当然1Byteつまり8bitの情報の識別量の256個では足りません。
そこで、パソコンの日本語の文字は常に2Byteを使います。これを「2バイト文字」とか「全角文字」とか呼んでいます。

[半角/全角]キーを押して日本語変換にしたときの文字は、2バイト文字と言う事になります。パソコンの2バイト、つまり16ビットは、2の16条つまり65536個の情報が識別出来ます。これだけ有れば7000ぐらいの文字情報は楽々と識別出来ますね。

ついでに、欧米で使われているアルファベットと数字と記号だけは1Byteの256個の情報の識別量だけで十分足ります。これは、[全角/半角]キーを押して日本語変換停止で入力出来る文字で、一バイト文字とか半角文字とか言います。

ここまで来ると、大体お分かりだと思います。
今、10KB(10キロバイト)のファイルがあるとしますと、キロバイトは1000バイトなので10KBのファイルは10000Byteと言う事になります。

日本語の1文字は2バイトですので、10000Byteの容量のファイルには単純に計算して5000文字が入る事になります。

でも、実際にはそのファイルそのものの情報もありますのでこれだけの文字は入りません。エディタなどのソフトでは4500文字ぐらいになります。特にワードなどのワープロのソフトでは、文字の大きさ、色、文字種(明朝体とかゴシック体など)の情報も一緒に保存されますので5000文字のファイルは30キロバイトぐらいに大きくなります。

「バイト」の意味が大体お分かりだと思います。

では、40GB(40ギガバイト)のハードディスクには文字だけ入れたらどのくらい入るのでしょうか?G(ギガ)とは10億ですから40GB(40ギガバイト)は400億バイトと言う事になります。
つまり、200億個の文字が入る計算になります。
パソコンのデータは文字だけではありませんが大体の容量の目安にして下さい。

(注意)
K(キロ)は1000です。
M(メガ)は100万です。
G(ギガ)は10億です。
Byteは略してBと書きます

 前の項目へ   Kzemi講座へ戻る   次の項目へ