ハードウェア・ソフトウェア
文字コード
Character Encoding
概要
文字をコンピュータ上で扱うために、各文字に一意の番号を割り当てた体系。
詳細解説
文字コードは、文字と数値の対応関係を定めた規格である。ASCIIは英数字を7ビットで表現する基本的な文字コードで、128種類の文字を扱える。日本語にはJISコード、シフトJIS、EUC-JPなどの文字コードがある。
Unicodeは世界中の文字を統一的に扱うための国際規格で、UTF-8はその代表的な符号化方式である。UTF-8はASCIIと互換性があり、Webの標準文字コードとして普及している。
試験対策のポイント
- 暗記必須:文字コードは文字に番号を割り当てる体系。ASCII(英数字・7ビット)、JISコード、シフトJIS、EUC、Unicode(UTF-8等)を区別。
- 頻出ポイント:Unicodeは世界中の文字を統一的に扱う規格。UTF-8は可変長で、ASCII互換のため広く普及している点が問われる。
- ひっかけ注意:文字化けは送信側と受信側の文字コードの不一致で起こる。シフトJISとUTF-8など、コード体系の違いが原因。
事例・具体例
HTMLファイルの文字化けは、作成時と表示時の文字コードが異なることが原因で発生する。UTF-8の普及により文字化け問題は減少傾向にある。