Re: comment for Kana-Kanji Translation
山村 from JANISです。
すいません。かな漢字変換のお仕事から外れて随分になるので、
ほとんど調べてないで、印象だけで記事を書いてます。その点
お断りしておきます。<(_ _)>
In article <cofr9a$fmh$1@cobalt01.janis.or.jp>,
Takashi Yamamura <vyama@janis.or.jp> wrote:
>これまで来た道をたどっているようにも見える
そもそも同音異義語の選択を一発で正解を出すのは彼らの問題
意識になくて、そこそこの候補が出せればいいのかも。だと
すると随分話が違ってくるんですが、一応「なるべく一発で
正解を出す」のを彼らもこだわっているという前提で話します。
前述のとおり全然調べてないんですが、彼らの採用している
ロジックには何か新しい発想があるんじゃないか、少なくとも
それを作り出そうとしているんではないかと思います。(半分
願望)だから「来た道」をたどっているのとはちょっと違う
かな。ただ、文法ロジックだけでうまくいくように見えても、
いずれ変換精度で壁にぶつかるだろうと思います。
で、文法ロジックの変換精度だけでやる、変換精度を上げることは
その制限内でやるというのでなければ、どんな文法ロジックを
使ったとしても、いずれ「語と語の個別の関係性(=共起)」を
利用するようになるだろうと思います。
で、共起をどう利用するかってのも色々ある訳で、それは
「これまで来た道」とは全然別のロジックで利用するかもしれません
よね。だから文法ロジックだけで行けば、「これまで先人が
ぶつかってきた壁」にぶち当たることは予想しますが、そのあと
「誰かがたどった道」でその問題を解決するとは限りません。
私たちがやってたときは共起に注目してやるのが一番いいと
いう結論だったのですが、別のロジックを開発できるかも
しれないし、「語と語の関係性」にしても私たちがやった
ようなのとは別の利用の仕方があるかもしれません。
だから「これまで来た道をたどっているようにも見える」と
いう問いに関してはNO。ただし、「これまでにたどりついた
場所には行くかも」はYESです。ただし半分以上願望付きでって
いうのは認めます。(笑)
>教えてくださったURLにある論文summaryしか読めないのですが、
やっぱりあの要約だけじゃ分かるの無理ですけど(笑)、あの論文の
執筆者をキーワードにして検索してみると色々見つかるかもしれ
ないですね、というつもりで紹介しました。
>従来から日本語入力プログラムが採ってきている方向性が有効だと
>証明した論文でしょうか。
YES/NOで答えろと言われればYESです。あの論文の要旨をすご〜く
口当たりのいい言葉(笑)に直すと「新聞などから取ってきた
係り受けの個別事例(≒共起)を、データベースに片っ端から
ぶち込んで、それを同音異義語の判別に使うと効果がある」という
論文です。もちろん、100%同音異義語の判別ができるって訳じゃ
ないですし、正直同音異義語の判別に使ったテストケースも
少なすぎると思うんですがね。
--
山村 隆志 e-mail : vyama@janis.or.jp
「debugは3歩後退、2歩前進、いつまでたっても終らない」
Fnews-brouse 1.9(20180406) -- by Mizuno, MWE <mwe@ccsf.jp>
GnuPG Key ID = ECC8A735
GnuPG Key fingerprint = 9BE6 B9E9 55A5 A499 CD51 946E 9BDC 7870 ECC8 A735