Re: Japanese Spam in Big5

From(投稿者):	yas@is.tsukuba.ac.jp (Yasushi Shinjo)
Newsgroups(投稿グループ):	fj.comp.security,fj.mail,fj.kanji
Subject(見出し):	Re: Japanese Spam in Big5
Date(投稿日時):	10 Dec 2007 05:37:01 GMT
Organization(所属):	Institute of Information Sciences and Electronics, University of Tsukuba
References(祖先記事, 一番最後が直親):	(G) <071205104938.M0128109@nanyanen.lbm.go.jp>
(G) <YAS.07Dec5114333@kirk.is.tsukuba.ac.jp>
(G) <071208084410.M0132167@nanyanen.lbm.go.jp>
Message-ID(記事識別符号):	(G) <YAS.07Dec10143701@kirk.is.tsukuba.ac.jp>

From(投稿者):

yas@is.tsukuba.ac.jp (Yasushi Shinjo)

Newsgroups(投稿グループ):

fj.comp.security,fj.mail,fj.kanji

Subject(見出し):

Re: Japanese Spam in Big5

Date(投稿日時):

10 Dec 2007 05:37:01 GMT

Organization(所属):

Institute of Information Sciences and Electronics, University of Tsukuba

References(祖先記事, 一番最後が直親):

(G) <071205104938.M0128109@nanyanen.lbm.go.jp>

(G) <YAS.07Dec5114333@kirk.is.tsukuba.ac.jp>

(G) <071208084410.M0132167@nanyanen.lbm.go.jp>

Message-ID(記事識別符号):

(G) <YAS.07Dec10143701@kirk.is.tsukuba.ac.jp>

記事全体へのコマンド

新城＠筑波大学情報です。こんにちは。

In article <071208084410.M0132167@nanyanen.lbm.go.jp>
        toda@lbm.go.jp writes:
> >漢字の部分は、Big5 をそのまま使ってかなの部分を数値文字参照
> >にしたわけですね。敵も考えてはいますね。
> 本当に「考えた」のかどうか、疑問視してるんですけどね^_^;
> 文字コードを変換する際に、
> unicodeを「中間コード」に使うシステムというのは多々あるだろうと思います。
> ＃MicrosoftWordに一旦読み込ませる方法が該当するのかな？
> その際、変換先コードで表現できない文字は数値文字参照にしてしまう
> というのは、ごく普通にありそうな処理だと思うのですが、どうでしょう？

なるほど。面白い分析です。たしかにこれだと、あまり自然知能が
働いている感じがしません。

なぜ日本語文字列を Big5 に変換しようとしたのかという話が残り
ますね。単に spam filter をだませるのではないかと期待したと
いうよりは、Big5標準の環境の OS で編集したらそうなってしまっ
たという話かな。

学生の時、アメリカで何かの店で、英語通じない時に、店員さんが
助けを呼びにいったら中国人だったというのはありましたね。漢字
で筆談すれば通じたかもね。かな漢字変換なしに漢字が書けないと
いう話があるんだが。

＼＼　新城　靖　（しんじょう　やすし）　＼＼
＼＼　筑波大学　電子・情報　　　　　　　＼＼

Fnews-brouse 1.9(20180406) -- by Mizuno, MWE <mwe@ccsf.jp>
GnuPG Key ID = ECC8A735
GnuPG Key fingerprint = 9BE6 B9E9 55A5 A499 CD51 946E 9BDC 7870 ECC8 A735