2014/03/24(月)今更ながら乱数放送の中身を考える

2014/03/24 17:09 SWL
乱数放送といえば、受信行為そのものが怪しいイメージの上にマニアックであり、
その内容まで考えたことは無い人が大半ではないかと思います。

実際のところ、「乱数放送」といっても、送り手と受け手である種の決め事を予め決めておき、規則的に数字を並べているに過ぎません。
その規則を知らなければ単なる無意味な数字の羅列・・・乱数にしか聞こえないわけです。

ごく簡単に「乱数放送」を模擬してみましょう。
コンピュータで文字を表現する場合、文字の一つ一つに文字コードというのを割り当てます。
旧ラテン語圏であれば、100もあれば足りるでしょうが、日本語など文字種が多いと、その数は数千は必要になりますね。

日本語の場合、コンピュータに使われている文字コードは複数乱立しており、1980年代には既に主だったものだけでも3つありました。
以下は、SHARP MZ-2500 オーナーズマニュアルにまとめられていた文字コード表のごく一部を抜粋したものです。



例えば「開局」という文字をコンピュータで表現する場合、上記の区点コードでは 1911 2241 と表現します。
両者で「日本語の区点コードを使う」と事前に申し合わせておけば、 1911 2241 と送り手で数字の羅列を送れば、受け手はこの文字コード表から解読して「開局」という文字が復元できる、というわけです。

5桁にしたければ、シフトJISコードまたはJISコードを使います。
同じ文字をシフトJISコードで表現すれば、 35402 35783 (それぞれ 16進数表記を 10進数に変換)となり、
JIS コードで表現すれば、 13099 13897 (それぞれ 16進数表記を 10進数に変換)となります。

同じ文字でも、別の文字コードにすると、こんなふうに送り手の内容は全く違ったものになることが判ります。

実際の乱数放送はもっと複雑なことをしていると考えられますが、イメージとしてはこんな感じだと思います。

蛇足ですが、現在はコンピュータ上の文字コードとして、区点コードは殆ど使われず、シフトJISが日本語版のWindows や Web サイトの一部で利用され、JIS コードは電子メールなどの文字コード ISO-2022-JP として、国際標準の日本語文字コードとして位置づけられ、更に Unix や Linux 上では EUC-JP 、 UTF-8/UTF-7/UCS-2/UCS-4 といったUnicode 群など、乱立している状態です。

北朝鮮の乱数放送は、かつては、日本の小説をベースにした独自の解読表が使われているといった推測がなされていたりしましたが、実際のところは不明です。