Emacs で分離した濁点をもどすには ucs-normalize-NFC-region
新城@筑波大学です。こんにちは。
端末で動く Emacs ではなくて、ウインドウ・システムを使っているEmacs の場
合、コピー&ペーストでテキストを持ってくると、仮名の濁点が分離すること
があります。PDFからペーストするとよくなります。こんな感じ。
テ゛ィレクトリ
MacOSX の iTerm は、自動的に元にもどしてくれるのでありがたいです。
Emacs 単体でできないかと思ったのですが、そういう関数がありました。
ucs-normalize-NFC-region
NFC や NFD は、Normalization Form Composition
Composition/Decomposition。濁点に関しての説明は、このページがわかりやす
いです。MacOSX のファイル名の話として書かれています。
http://www.sakito.com/2010/05/mac-os-x-normalization.html
2010年5月16日, sakito
Mac OS X におけるファイル名に関するメモ(NFC, NFD等)
「テ゛」が Decomposition された状態で、「ディ」が Composition 。
ucs-normalize-NFC-region の逆の ucs-normalize-NFD-region もあります。
Emacs 23.3 から入ったようです。
http://www.gnu.org/software/emacs/news/NEWS.23.3
これは、-regsion なのですが、バッファ全体にやりたい人は、次の関数を使っ
ても良いのでしょう。
http://sky-y.hatenablog.jp/entry/20120805/1344169124
2012-08-05, sky-y
Emacs小ネタ: MacでPDFからコピーすると濁点が分離する問題を直す
これはなくても、M-< M-> してから ucs-normalize-NFC-region でも大丈夫です。
\\ 新城 靖 (しんじょう やすし) \\
\\ 筑波大学 システム情報系 \\
Fnews-brouse 1.9(20180406) -- by Mizuno, MWE <mwe@ccsf.jp>
GnuPG Key ID = ECC8A735
GnuPG Key fingerprint = 9BE6 B9E9 55A5 A499 CD51 946E 9BDC 7870 ECC8 A735