ハードウェア・ソフトウェア

文字コード

Character Encoding

概要

文字をコンピュータ上で扱うために、各文字に一意の番号を割り当てた体系。

詳細解説

文字コードは、文字と数値の対応関係を定めた規格である。ASCIIは英数字を7ビットで表現する基本的な文字コードで、128種類の文字を扱える。日本語にはJISコード、シフトJIS、EUC-JPなどの文字コードがある。

Unicodeは世界中の文字を統一的に扱うための国際規格で、UTF-8はその代表的な符号化方式である。UTF-8はASCIIと互換性があり、Webの標準文字コードとして普及している。

試験対策のポイント

暗記必須：文字コードは文字に番号を割り当てる体系。ASCII（英数字・7ビット）、JISコード、シフトJIS、EUC、Unicode（UTF-8等）を区別。
頻出ポイント：Unicodeは世界中の文字を統一的に扱う規格。UTF-8は可変長で、ASCII互換のため広く普及している点が問われる。
ひっかけ注意：文字化けは送信側と受信側の文字コードの不一致で起こる。シフトJISとUTF-8など、コード体系の違いが原因。

事例・具体例

HTMLファイルの文字化けは、作成時と表示時の文字コードが異なることが原因で発生する。UTF-8の普及により文字化け問題は減少傾向にある。