No:
703
タイトル:
GEAR戦士撫子 新Part697
お名前:
プロフェッサー圧縮
投稿日:
2026/04/08 07:10:37
単表示
返信
それではここから実態の文字コードを取り出して行きましょう。
1バイト目は2バイトコード用マスクb00011111、2バイト目は固定でb00111111です。
これと0xc080=b11000000 10000000のANDを取りますと・・・・・・
b11000000 1000000
b00011111 0011111
------------------
b00000000 0000000
となり、文字コードは0x0000となります。
◇ ◇ ◇
これの何が問題なの? と言いますと。
0x00は文字列処理において特別な意味があるからです。
この特殊文字はnullとも言いまして、通常文字列の終りを示すのです。
◇ ◇ ◇
文字列というのは本質的に可変長です。
コンピュータの場合、決め打ちで30文字等とするようなこともありますが・・・・・・
それは概ね処理の都合に過ぎないのです。
◇ ◇ ◇
まあ短歌等は文節の文字数決まってはいますが・・・・・・
それはそういう「遊び」であって、通常の文章にそんな縛り設けても邪魔でしかありません。
なのでほとんどの文章は可変長であり、またそうあるべきなのです。