掲示板に戻る
No:703 タイトル:GEAR戦士撫子 新Part697 お名前:プロフェッサー圧縮 投稿日:2026/04/08 07:10:37 単表示 返信

それではここから実態の文字コードを取り出して行きましょう。

1バイト目は2バイトコード用マスクb00011111、2バイト目は固定でb00111111です。

これと0xc080=b11000000 10000000のANDを取りますと・・・・・・

b11000000 1000000
b00011111 0011111
------------------
b00000000 0000000

となり、文字コードは0x0000となります。


          ◇          ◇          ◇


これの何が問題なの? と言いますと。

0x00は文字列処理において特別な意味があるからです。

この特殊文字はnullとも言いまして、通常文字列の終りを示すのです。


          ◇          ◇          ◇


文字列というのは本質的に可変長です。

コンピュータの場合、決め打ちで30文字等とするようなこともありますが・・・・・・

それは概ね処理の都合に過ぎないのです。


          ◇          ◇          ◇


まあ短歌等は文節の文字数決まってはいますが・・・・・・

それはそういう「遊び」であって、通常の文章にそんな縛り設けても邪魔でしかありません。

なのでほとんどの文章は可変長であり、またそうあるべきなのです。