IT用語入門:文字コード【文字を数字に対応づける仕組み】

PR
PR

PR

バナー

文字コードとは

文字コードとは、文字や記号をコンピューターが扱える数値とバイト列に対応させる規則です。機械は文字そのものを理解できないため、各文字に番号(コードポイント)を与え、それを0と1のデータとして保存・送受信します。これにより、文書やメッセージを正しく記録し、別の機器でも再現できるようになります。

イメージとしては、辞書で「A=65」のように共通の番号表を約束することです。同じ約束を使う機器やアプリなら、保存したデータを読み出したときに同じ文字が再現されます。番号は最終的にビットの並びに変換され、画面表示や印刷の基礎になります。

番号をどのようにバイト列へ並べるかという具体的な方式がエンコーディングです。英数字中心のASCIIは扱える文字が少なく、多言語を統一的に扱う規格がUnicodeです。Unicodeをバイト列にする代表例がUTF-8とUTF-16で、UTF-8はASCIIと互換がありWebの主流、UTF-16はWindowsなどで使われます。

送信側と受信側で方式が一致しないと文字化けが起きます。ファイルや通信で使う文字コードを統一し、HTMLやアプリの設定で明示すると防げます。文字コードは、文字データを正しく保存・表示・共有するための土台です。役割を一言でまとめると、世界中の文字を同じルールで読み書きできるようにする仕組みであり、実務では迷ったらUTF-8が安全です。

関連用語

IT用語集一覧はこちら

PR

ユーキャンなら、約4か月でITパスポートの資格取得を目指せます。