情報の変換

情報は何らかの形で表現され,その表現形式を情報メディアと言います.今,読んでいるこの文章も表現方法の1つです.また,写真や画像を見た場合は,その写真や画像が情報となります.

情報は表現形式を変換できます(情報操作).このページは文字として書かれていますが,この文章を朗読している人から聞いた場合,情報は「文字」ではなく「音声」で表現されます.表現形式を変換すると,情報が付け加えられたり失われたりします.この文章を朗読すれば,文字にはない「音声(音のトーン)」が付加されます.ただ,一言半句漏らさずに要点だけを朗読した場合,その部分の情報は失われることになります.

情報を処理する際,最初の「生の情報」を入力,処理の結果として得られたものを出力と言います.また,未来に向けて情報を伝えることを情報の記録と言い,離れた場所に向けて情報を伝えることを情報の伝達と言います.

Column

人間社会で発生するできごとを,物理学の観点だけで全て語ることはできません.例えば,地震が発生したら,地震が発生した事実――地面がどのように揺れた等――は物理学の観点で説明できますが,どこでどのような被害がでたかは,物理学で説明することができません.よって,事実を完全に伝達するならば何らかの「情報」を付け加える必要があります.

しかし,情報は物理学と独立した存在ではありません.現実の世界に影響を与えるためには物理的に何らかの動作を行うことが必要です.ブログを書くとき,文字を入力するためにはキーボードやマウスの操作が必要で,これらは物理的行動です.よって,情報は科学的な取り扱いが可能であり,情報を取り扱うコンピュータは電磁気の法則に従って動作します.

一方,ある問題――計算問題等――の解法をアルゴリズムと言います.数学ではこの考え方が導入されていますが,決まった手順で計算するのに,計算結果は終わってみないと分からない現象が生じます(カオス).この概念は,情報の分野で確立された考え方が数学に導入された影響によるとされています.

アナログとデジタル

情報にはアナログ情報デジタル情報があります.アナログとは数学的に見て連続しているもの,デジタルとは数学的に見てとびとびの値をとっているものです.例えば,時間は切れ目なく続く量なのでアナログですが,サイコロの目は1から6までの整数であり,数学的には連続した値をとっていないので,デジタルです.

アナログ情報をデジタル情報に変換することをA/D変換,デジタル情報をアナログ情報に変換することをD/A変換と言います.深入りすると難しくなるので,詳細は割愛します.

コンピュータは情報を全てデジタル情報として記憶します.音楽が聴けたり,映像が見られるとアナログで扱っているように見えます.それは,音楽や映像を再生するソフトウェアがD/A変換を行っているからであり,情報の記憶自体はデジタルです.

アナログとデジタルの簡単な比較をした表を示します.

項目 アナログ デジタル
利点 中途半端な数値の情報を表現できる 後からその数値を正確に表現できる
欠点 前と全く同じ数値を再現するのは難しい 決められた数値以外の表現はできない

情報の単位

コンピュータは2進数,0と1だけで全ての情報を取り扱います.コンピュータは機械なので,「電気のオン・オフ」や「電圧が高い・低い」という判断しかできないからです.そして,この2つの状態を0と1に対応させます.これがコンピュータの情報の最小単位であり,ビットBInary digiTの略)と言います.8ビットで1バイト,8バイトで1オクテットになります.

情報量,例えばファイルの大きさ(容量)は全てバイト単位で表示されているはずです.ビットで表現することはあまりありません.1ビットの情報では意味の解釈が難しいですが,1バイトならば意味を解釈できます.ただし,あくまでコンピュータが分かるだけであって,人間が分かるかどうかは別です.

コンピュータで扱う文字には半角文字全角文字があります.半角文字は1バイト,全角文字は2バイトです.日本語は基本的に全角文字ですから,1文字で2バイト使うということになります.これに対して,英数字は基本的に半角文字です(日本語のワープロでは全角の英数字も使えますが,海外では違います).人間からすれば,1バイトの情報で何を意味するのは不明ですが,コンピュータは「文字であること」が分かります.

なお,ワープロで文字を打っていると,全角文字1字の幅は半角文字2字の幅になるときとそうでないときがあります.後者の場合,文字によって幅が違うプロポーショナルフォントを使っています(フォントとは字体のことです).逆に,全角文字1文字分が半角文字2文字分の幅になるものを等幅フォントと言います.

フォント(文字)の大きさはポイントで表し,数字が大きいほど字も大きくなります.また,画面上で見える字体とプリンタ等で印刷したものの字体が同じとは限りません.同じように印刷されることが保証されているフォントをTrueTypeフォントと言います.

Caution

通常,カタカナは全角文字になりますが,半角文字のカタカナもあり,半角カタカナと言われます.これは機種依存文字(特定の種類であるパソコンでしか表現できない文字)の1つであり,他人のパソコンでは正確に表示されないことがあります.たいていの場合,変な記号や漢字が表示されてしまい,読むことができません(この現象を文字化けと言います).よって,機種依存文字は使わないようにするべきです.

情報量に限らず,何らかの単位を扱うときは補助単位を使います.補助単位がないと,大きい数字や小さい数字を扱うのが面倒です.ここでは,情報量の補助単位を示します.

補助単位 読み方 数値
kキロ210
Kキロ103
Mメガ106
Gギガ109
Tテラ1012
Pペタ1015
Eエクサ1018
mミリ10-3
μマイクロ10-6
nナノ10-9
pピコ10-12
fフェムト10-15

kとKは大文字と小文字で意味が違います.また,210=1024ですが,約103=1000とも言えます.「1キロバイト」と言ったとき,1000バイトを示すこともありますし,1024バイトを示すこともあります.コンピュータが情報量を表示するときも,場合によって違います.なお,2のべき乗とする考え方があるのは,コンピュータが2進数に基づいてデータを取り扱っているからです.

2進数・16進数とその応用

2進数・16進数の演算

ここでは,10進数の0から16が,2進数・16進数でどのように表されるかを示します.

10進数 2進数 16進数
000
111
2102
3113
41004
51015
61106
71117
810008
910019
101010A
111011B
121100C
131101D
141110E
151111F
161000010

16進数では15までの数を1桁で表せますが,数字は0から9までなので,10から15はアルファベットを使います(大文字でも小文字でも構いません).

人間は10進法を使っているので,計算も10進数で行いますが,コンピューターでは2進法が基本なので,計算は2進数で行います.小学校で学習した筆算は,10進法以外でも同じ考え方ができます.具体例を示します.

10進数と2進数の筆算

桁上がり(キャリー)桁借り(ボロー),小学校の言葉では「繰り上がり」と「繰り下がり」ですが,これらに気をつければ,10進数に直さなくてもそのまま計算できます.

文字の表現

コンピュータでは文字を扱いますが,文字も数値と同様に0と1の並びで表します.数値・文字は全て0と1の組み合わせで表現され,そのパターンをビットパターンと言います.そして,文字情報に対応するビットパターンを文字コードと言います.文字コードにはいくつか種類がありますが,ここではその一例を示します.

文字コード表(一部)
C D E F
1 AJ1
2 BKS2
3 CLT3
4 DMU4
5 ENV5
6 FOW6
7 GPX7
8 HQY8
9 IRZ9

表の1行目と1列目は16進数です.文字は,対応する行と列の値を並べて16進数2桁(=1バイト)で表します.上位4ビットは行,下位4ビットは列に対応します.例えば,文字のEは,16進数でC5(2進数に直すと11100101)です.

同じ文字でも,文字コードによって対応するビットパターンが異なります.よって,ある文字コードで表された文章を,別の文字コードで表そうとすると,意味不明な文字がでてきて読めないことがあります.この現象を文字化けと言います.

マルチメディア

コンピュータを使って画像を処理することをコンピュータグラフィックス(CG)と言います.また,コンピュータを使って音楽を演奏したり作編曲を行うことをコンピュータミュージックDTMと言います.色々なデジタル情報をまとめて処理・通信することをマルチメディアと言います.

画像の表現形式には,碁盤の目のように縦横にしきつめられた点(画素またはピクセル)の集まりで画像を表現するビットマップ表現と,図形(四角形や直線等)の集まりとして画像を表現するセグメント表現があります.

ビットマップ表現とセグメント表現を比較した表を,下に示します.

項目 ビットマップ表現 セグメント表現
利点 どのような画像でも表現できる. 比較的情報量が小さく,画像を拡大縮小しても画像の精度が落ちない.
欠点 情報量が大きく,画像を拡大表示すると画像の精度が落ちる(見た目が悪くなる). 写真等の画像の表現には向いていない.

情報を保存する形式を規格(フォーマット)と言います.画像をどの規格で保存するかは多くの種類がありますが,だいたいは上の2つです.

静止画に比べて動画は圧倒的に情報量が大きくなるため,データの圧縮が行われます.圧縮は動画に限らず,基本的にどのデータでも行えます.一例として,動画全体を1コマずつに分割し,2コマ目は1コマ目と違う部分だけ(2コマ目の情報は1コマ全てではありません)保存する方法があります.これはフレーム間相関を利用したものです.

ファイル管理

ファイル名の構造

コンピュータは,データをファイルとして保存します.例えば,1枚の画像は1つのファイルとして保存されます.しかし,たくさんのデータがあるとファイルだらけになり,どこに何があるのか分かりづらくなります.そこでフォルダ(ディレクトリ)を使って,ファイルを分類します(分類自体は人間が行います).ファイルが紙だとしたら,フォルダはバインダーです.

ファイルの名前は基本的にxxxxxxxx.yyyの形式です.xとyの文字数は,現在ではあまり気にしなくても構いません.xの部分には好きな名前をつけることができます(一部使えない文字があります).yの部分は拡張子で,ファイルの種類ごとに決まっています.

Column

以前は,xは8文字まで,yは3文字までという制約がありました.Windowsでは,255文字までのロングネームをつけることができます.最近では,xに空白文字や全角文字も使えるようになりました.また,「.tar.gz」のように,ドットが複数含まれる拡張子もあります.

フォルダには拡張子がなく,好きな名前をつけることができます.また,ファイル名はアルファベットの大文字と小文字を区別することとしないことがあります.これは,コンピュータによって取り扱いが違います.なお,ファイル名やフォルダ名に日本語を使う方がいますが,一部の方はそれを嫌います.実際,コンピュータによっては,日本語(全角文字)を使った名前のファイルは扱えないこともあります.

Caution

ファイルの拡張子は手動で変えることもできますが,変えればどんなファイルとしても扱えるわけではありません.例えば,テキストファイル(拡張子は.txt)をプログラム実行ファイル(拡張子は.exe)にするために拡張子を変えて実行しても,何が起こるかは保証されません.

パスの管理

ファイルがどこにあるか表すものをパスと言います.場合によってはC:\やD:\というものがつきます.これはドライブレターで,大雑把に言えば,フォルダをさらに整理するものです.

簡単なファイル管理について例を示します.

C:\
image\
me.bmp
friend.bmp
report.txt

C:\の下にimageフォルダがあり,その中にme.bmpとfriend.bmpの2つのファイルがあります.それとは別に,C:\の下にreport.txtファイルがあります.

絶対パスでme.bmpの位置を示すと,C:\image\me.bmpとなります.フォルダごとに\という文字で区切ります.区切る文字は/の場合もあります.

しかし,全てを絶対パスで扱うと,ファイルを指し示す文字列が長くなって面倒です.現在,自分がどのフォルダで作業をしているのかをカレントフォルダと言いますが,相対パスはそれを使います.例えば,imageフォルダがカレントフォルダなら,friend.bmpのパスは.\friend.bmpとなります.ここで,.\とは,カレントフォルダという意味で,明示的につけなくても構いません.

一方,imageがカレントフォルダのときにreport.txtを参照したいときは,フォルダの位置が違うため,1つ階層を上がって示さないといけません.この例では,..\report.txtと表します...\は1つ上のフォルダを表します.

Column

UNIX等でファイルの操作をする場合,ログインした状態で作業を行うディレクトリを,一般にホームディレトリと言います.

ワイルドカード

ファイルの検索時や,複数のファイルを同時に処理したい場合はワイルドカードを用います.コンピュータによって異なりますが,*が任意の文字列,?が任意の1文字となります.*.bmpと指定すれば全てのbmp拡張子をもつファイルを指すことになります.

ファイルの属性

ファイルやフォルダは自由に作り,変えて,消すことができます.しかし,消したり書き換えられたりすると困るファイルもあります.そのため,ファイルに設定(属性)をつけることがあります.

1つは隠しファイルです.これは,ファイル一覧を表示させたときに表示されないようにする設定です.パソコンの設定を変えれば表示させることもできますが,だいたいの場合,いじるとパソコンがうまく動かなくなることが多いです.

もう1つは読み取り専用ファイル(リードオンリー)です.例えば,CDに収録されているファイルを書き換えられると,困る場合があります.この属性がついているものは,読み取ることはできますが,書き込むことはできません.書き込んで保存するときは,この属性を解除します.