前のパートに戻る 完了して次のパートへ  

  1-5. 文字コードについて

【文字コードについて】


今回は文字コードについてです。

コンピューターは、ファイルなどのデータを0、1の2進数で管理しています。そのため、ファイル内のデータは、実際は0、1の2進数の羅列になっています。

コンピューター
 ||
2進数


ファイル内
 ||
2進数の羅列

文字コードはこの2進数の数字を文字に読み換えたものになります。たとえば、アルファベットの大文字の「A」は、10進数の数字で表すと「65」という数字になります。また、16進数の数字で表すと「41」という数字になります。

文字コード
 ||
2進数の数字を文字に読み換え

ASCII
https://ja.wikipedia.org/wiki/ASCII
Wikipediaのアスキー文字のページ。詳細はリンク先を参照。

英数字はこのように16進数2桁、つまり1バイトの数字で表すことができます。

しかし、日本語は文字数が多いので、2バイトで文字を表します。この場合、日本語の文字コード、2進数の数字を文字に読み換えたものは、「Shift_JIS」や「EUC」、「UTF-8」など様々な種類があります。この文字コードの種類によって、数字と日本語の文字の対応が異なっています。

Shift_JIS
EUC
UTF-8

Webの世界では「UTF-8」をメインに使います。本コースでも、この「UTF-8」でファイルを作成していきます。

UTF-8

このあとで紹介するテキストエディタのAtomでは、ファイルを「UTF-8」の形式で保存してくれます。他のエディタを使う際には、保存形式を「UTF-8」にして利用してください。

というわけで、今回は文字コードについて話をしました。

このコースの評価は?