掲示板に戻る
No:661 タイトル:GEAR戦士撫子 新Part656 お名前:プロフェッサー圧縮 投稿日:2025/06/25 07:02:35 単表示 返信

少し前にASCIIは7ビットコードであると述べました。

繰り返しますが現代コンピュータは8ビット=1バイトを最小単位として扱いますので、取りうる値の半分近くを投げ捨てていることになります。

しかし半分と言っても、所詮120文字程度しか空きはありません。

これまた繰り返しになりますが、たったそれだけでは万単位にも及ぶ漢字を収録することなど不可能です。

何しろ限定しまくった当用漢字ですら千単位ですからね。

誠にもって自明の理というものです。


          ◇          ◇          ◇


ではどうするか?

結論から言いますと・・・・・・

「現れた文字コードがASCIIの範囲内であれば1バイト1文字、逸脱しているなら後続の1バイトを追加して2バイト1文字」

と扱うことにしたのです。


          ◇          ◇          ◇


つまりASCIIでは使われていない領域にSIの機能も持たせるという、効率に振った画期的な方法です。

メモリが足りない足りないとピーピー言ってる割にSI/SOで2バイトずつ余分に増やすのは、まあ明らかに無駄でしたからね。

漢字が続けば気にならないのかも知れませんが、先程の日付の例のように数字+漢字のパターンは多いですからね。

相当に水ぶくれするのは容易に想像できます。


          ◇          ◇          ◇


ちなみに。

このShift-JIS、「JIS」と付いている割に政府機関が検討制定したものではありません。

民間の大手が集まって、彼らの製品でだけ通用する独自ローカル規格だったのです。