掲示板に戻る
No:689 タイトル:GEAR戦士撫子 新Part683 お名前:プロフェッサー圧縮 投稿日:2025/12/31 11:34:25 単表示 返信

EUC-JPはENIACに端を発する巨大コンピュータと個人用途のPCの中間に当たるワークステーション用OS・UNIXの漢字コードで、所謂サーバー系に普及しました。

対応する文字はJISコードとほぼ同等ですが、1文字のバイト数が1~3バイトと変動するのがポイントとなります。

その意味ではShiftJISより処理が面倒ではありますが・・・・・・

先頭バイトで後続があるかはすぐわかるようになってはいます。


          ◇          ◇          ◇


「大して処理変わらないならJISコードそのままでよかったんじゃないか」と思ったそこの貴方。

原理的に言えば確かにそうなのですが・・・・・・

しかしそうも言ってられないUNIX特有の事情というものがあったのです。


          ◇          ◇          ◇


UNIXはエスケープコードという特殊文字で諸々の制御を行っていました。

界隈で有名なのは16進数表記の0x5cで、これはJISコードでは「\」を意味します。

例えば\nと書くとこれは改行コードになるのです。


          ◇          ◇          ◇


これの何がまずいかと言いますと・・・・・・

JIS漢字コードの一部に下位バイトが0x5cのものがあり、ちゃんと漢字モード処理をしてないとエスケープコードと勘違いして文字化けします。

先程も触れましたが、エスケープコードは改行等の制御が割り当てられていますので・・・・・・

最悪画面全体がぐちゃぐちゃになるのです。