新城@筑波大学情報です。こんにちは。
Gnus の話にもどりそうだけど、

In article <b9yfz3us8ms.fsf@jpl.org>
        Katsumi Yamaoka <yamaoka@jpl.org> writes:
> こんにちは、山岡です。
> 近い将来に Emacs 21.4 に含まれるはずの Gnus v5.11 には次のデフォ
> ルトの設定があります。

> 1. no および fr ニュースグループに送信する記事に iso-8859-1 の
>    文字があったら、ヘッダとボディの両方ともそのまま送信する。
> 
> 2. 1 と同様に fido7 および relcom の各グループでは koi8-r の文字
>    を素通しにする。
> 規則を日本語用に追加する必要は無いだろうというのがぼくの判断です。

Gnus でも、私はこの手の配慮を fj でもやってくれるといいなあ
と思います。(具体的にどうはればいいんですか?)

> 最近の Emacs の開発者の意見に、同じテキストを扱うことができる
> charset が複数ある場合、返信するときは元の記事の charset を踏襲
> するのが良いのではないかという意見もあります。それは、同じ 8bit
> 文字でも使うことができる Latin-* charset が複数あるという背景が
> あるようで、ぼくはいまいち気乗りがしない議題ではありますけれど。

国際化して日本語が使いにくくなるというのはよくある話ではあり
ますが、簡単に避けられるなら避けたいわけです。(Mule から 
Emacs になって、日本語は大分使いにくくなりました。)

としては使いにくくなった部分
が多いのですが、

> できれば認めていただきたいのですが、ぼくも fj を永く利用している
> 側の人間で、最初に fj の読み書きに使ったのは Nemacs 3.3.1 と
> GNUS v3.13 です。その立場からの発言と捉えていただければ幸いなの
> ですが、いつまでも junet コードに限定する規則を守ることは必要で
> しょうか?

JUNET/fj で「JIS コードを使う」といことは、技術的な議論を積
み重ねて、合意したものです。これを変更するのは、同じくらい議
論を積み重ねて合意を取り直す必要があるでしょう。(国連決議を
無視して既成事実を作るという方法を取るというなら議論は不要な
んだけど。)

JIS, Shift-JIS, EUC-JP の間は、同じ文字集合(本当の意味)を別
の方法で符合化(encode)したものです。ですから、相互に変換する
ことが完璧にできます。変換の過程で情報が落ちることはありませ
ん。Emacs でも、JIS, Shift-JIS, EUC-JP の間は、簡単に変換で
きます。ネットワークに送り出す時に標準化して送り出すというの
は、常套手段です。htnl() で network byte order (big endian) 
にするとか。

これらを総合すると、JIS, Shift-JIS, EUC-JP については、JIS
(junet) にして送り出すというのは、現在においても合理的です。

> > MIME みたいに、あとから出てきたしょうもない規格に、fj が従う
> > 理由は、どこにもありません。
> 従う理由は無いですけれど、譲歩してはいけない理由も無いのでは?

上で書いたように、標準化してネットワークに出すのは合理的なわ
げです。Date: を JST じゃなくて +0900 で出すようなものです。

> > なんでそこまでして EUC で出したい、MIME で出したいのかも聞い
> > てみようかなあ。
> 
> Gnus に関して技術的な側面から少し補足しておきます。Emacs はファ
> イルの読み書きに使う coding-system に優先度を持たせてあり、日本
> 語環境の UNIX 系では euc-japan が、Windows 系では shift_jis が第
> 一候補になっています。MIME charset の優先度をそれに準じて決定し
> てしまうために、ちょっと古い Gnus または日本語以外の言語環境で起
> 動した Gnus では euc-japan などの記事が送信されてしまう性質があ
> り、多くの場合、ユーザが意図的に行なっているわけではないでしょう。

これは、Emacs 固有の都合かなあ。でも、Emacs では、
process-coding-system (NNTPでつかう)と file-coding-system は
別なんじゃないかなあ。それなら、process-coding-system が、
junet でも別にいいんじゃないかなあ。(file と proces にコピー
するのは、もともとおかしい。file を terminal にコピーするの
がおかしいのと同じ意味で。)

でも、NNTP を JIS と思うのも変かもね。1つのファイルに複数の
文字集合、文字符合が混じっているということかな。そうなると、
解釈するには、上の層の知識が必要ですね。つまり、ニュースグルー
プ群ごとの標準の文字集合とか文字符合化とかの知識です。結局
こういう話になるんじゃないかなあ。

> 1. no および fr ニュースグループに送信する記事に iso-8859-1 の
>    文字があったら、ヘッダとボディの両方ともそのまま送信する。
> 2. 1 と同様に fido7 および relcom の各グループでは koi8-r の文字
>    を素通しにする。

\\ 新城 靖 (しんじょう やすし) \\
\\ 筑波大学 電子・情報       \\