文字コードにはどんな種類がある?

どのプログラミング言語でも必要になってくるスキルの一つとして「文字コード」があります。よくある文字コードをまとめておきます。

文字コード特徴
JISコード
インターネットや電子メールで日本語を表記する際に、最も標準的に使用されている文字コード。日本工業規格(JIS)により定められた7ビット単位の符号化方式で、通常の文字列では表現できない特殊な文字や機能(制御文字)については、エスケープシーケンスという。
Shift-JISコード(SJIS)Micrsoft社により定められたコード。WindowsやMS-DOS、Macで使用される。エスケープシーケンスは使用されていない。半角文字も全角文字も一律2バイト(16ビット)で扱うので、表示された文字数とバイト数が一致するという特徴がある。また文字の前半8ビットで半角か全角を区別することが可能。
ASCIIコードAmerican standard Code for Information Interchangeの略。
アメリカ規格協会(ANSI)が制定した文字コードで、1文字を7ビットで表現しており、誤り検出用に1ビットを不可した8ビットで構成されている。ラテンアルファベット、数字、記号、空白文字、制御文字などの128文字を表現することができる。
Unicodeコンピュータに適していない文字コードを使用すると、いわゆる文字化けを起こす。そういった問題を解決するために、ユニコード・コンソーシアムにより制定された。文字を4バイトで表現し、アルファベット、漢字、カナ、アラビア文字など世界中の文字を表現しようとしている。現在はISO規格化されており、JavaやXMLは基本コードしてUnicodeを採用している。そしてUnicodeで定義されてる文字を実際にデータとして使用する場合は、文字符号化方式(エンコーディング)により符号化して使用する。

誰かの役に立てれば幸いです。

コメントを残す

以下に詳細を記入するか、アイコンをクリックしてログインしてください。

WordPress.com ロゴ

WordPress.com アカウントを使ってコメントしています。 ログアウト /  変更 )

Google フォト

Google アカウントを使ってコメントしています。 ログアウト /  変更 )

Twitter 画像

Twitter アカウントを使ってコメントしています。 ログアウト /  変更 )

Facebook の写真

Facebook アカウントを使ってコメントしています。 ログアウト /  変更 )

%s と連携中