掲示板に戻る
No:691 タイトル:GEAR戦士撫子 新Part685 お名前:プロフェッサー圧縮 投稿日:2026/01/14 07:01:57 単表示 返信

という訳で。

暫くの間、文字コードはMS-DOS系(ShiftJIS)とUNIX系(EUC-JP)の二大巨頭体制が続きました。

お互い半角英数字以外の互換性は絶無でしたので、変換ツールや自動判別の技術が発展したのです。

幸か不幸かで言えば間違いなく不幸でしたが・・・・・・

まあ実情を考えれば致し方なし、ではあります。


          ◇          ◇          ◇


しかし。

ShiftJISもEUC-JPも、共通の欠点を抱えていました。

それは「後から文字を追加できない」です。


          ◇          ◇          ◇


制定当時の漢字は第一水準と第二水準の6,355文字しかないのに2バイト(65536文字分)あって余裕がないとかおかしいだろ、と思った其処の貴方。

まあパッと見おかしいですわよね。

その疑問はごもっともではあるのですが・・・・・・

実のところ、ここでも従来との互換性問題が足を引っ張っていたのです。


          ◇          ◇          ◇


まず第一に。

第一バイトの半分(0x00-0x7F)はASCIIとの互換性のために使えません。

これはSI/SOをなくした代わりに1バイトだけで第二バイトがある(漢字)かない(半角英数字)かを判別しなければならないためで、この時点で使える領域は半減します。

更にJIS系特有の問題として半角カナが0xA0-0xDFに居座っているためここも使えません。

このように上位バイトの使える部分ががっつり減ったため、漢字コードとして使える領域がとても狭くなったのです。