No:
691
タイトル:
GEAR戦士撫子 新Part685
お名前:
プロフェッサー圧縮
投稿日:
2026/01/14 07:01:57
単表示
返信
という訳で。
暫くの間、文字コードはMS-DOS系(ShiftJIS)とUNIX系(EUC-JP)の二大巨頭体制が続きました。
お互い半角英数字以外の互換性は絶無でしたので、変換ツールや自動判別の技術が発展したのです。
幸か不幸かで言えば間違いなく不幸でしたが・・・・・・
まあ実情を考えれば致し方なし、ではあります。
◇ ◇ ◇
しかし。
ShiftJISもEUC-JPも、共通の欠点を抱えていました。
それは「後から文字を追加できない」です。
◇ ◇ ◇
制定当時の漢字は第一水準と第二水準の6,355文字しかないのに2バイト(65536文字分)あって余裕がないとかおかしいだろ、と思った其処の貴方。
まあパッと見おかしいですわよね。
その疑問はごもっともではあるのですが・・・・・・
実のところ、ここでも従来との互換性問題が足を引っ張っていたのです。
◇ ◇ ◇
まず第一に。
第一バイトの半分(0x00-0x7F)はASCIIとの互換性のために使えません。
これはSI/SOをなくした代わりに1バイトだけで第二バイトがある(漢字)かない(半角英数字)かを判別しなければならないためで、この時点で使える領域は半減します。
更にJIS系特有の問題として半角カナが0xA0-0xDFに居座っているためここも使えません。
このように上位バイトの使える部分ががっつり減ったため、漢字コードとして使える領域がとても狭くなったのです。