« 食用にされる犬 | トップページ | 犬猫失敗話(3)--小さい犬小屋は危険 »

2013年6月 4日 (火)

Atokの辞書をAnthyの辞書に変換する

原因がたぶん、Atok for Linuxのサポート不良だと思われるが、仕事で使っているUbuntu 10.10のGUI(GNOME)の様子がときどきおかしい。このまま急にダウンされると困るので急遽代替機を買ってUbuntu 12.10をインストールした。

GNOMEのラッパーとなっている新しいGUI、Unityの数々の奇癖は、ググれば直す手段は出てくるが、面倒なのでそのまま使っている。いずれ、Unity自身が、正規のコンフィギュレーションメニューでも提供すべきだ。

Firefoxの日本語化のモンダイは、Ubuntu自身をアップデートすれば、なぜか解決する。
Javaや、DVD再生用のlibcssなどは、自分でインストールしなければならない。

問題は、長年蓄積されたAtok上のユーザ辞書だ。それをLinuxのデフォルトのjp IMEであるAnthy~霞用のユーザ辞書に変換しなければならない。

手短に結論から言うと、

Atokでユーザの登録単語のリストを得るのは簡単だから、そのファイルをAnthy~霞用のユーザ辞書、$HOME/.anthy/private_words_defaultファイルに変換転記すればよい。

Atok:
ふぁ[TAB]ファイル[TAB]名詞*

Anthy
ふぁ[SP]#T35*500[SP]ファイル

ここで、T35は名詞を意味し、500は中程度の優先度だ。

----こんな情報-----
"独立語" => "KJ", #単漢字
"単漢字" => "KJ", #単漢字
"名詞サ変" => "T30", #名詞 - する接続
"名詞ザ変" => "T30", #名詞 - する接続
"固有人名" => "JNM", #名詞 - 人名
"固有人他" => "JNM", #名詞 - 人名
"固有人姓" => "JNM", #名詞 - 人名
"固有地名" => "CN", #固有名詞 - 地名
"固有一般" => "KK", #固有名詞 - その他
"名詞" => "T35", #名詞 - 一般名詞
"感動詞" => "CK", #感動詞
"一段動詞" => "KS", #上下一段
"サ行五段" => "S5", #サ行五段
"ガ行五段" => "G5", #ガ行五段
"形容詞" => "KY", #形容詞
---もあるが----

自分でAnthy上でいろいろ単語登録をして、その結果を確かめた方がよい。ちなみにAnthyに「形容動詞」という品詞分類はなく、代わりにある「な、さ、などに接続する名詞」は、T00(Tゼロゼロ)である。Wikipediaで調べると、「形容動詞」という品詞名にそもそも、疑義があるらしい。強力な、迂闊な、などなど、どう見たって動詞じゃないもんねぇ。

上記の変換は、そのためのプログラムなど書かなくても、Vim(gvim)の強力な置換機能を使えば全ファイル一瞬で済む。最初は、T35...などの冒頭に付けるべき#をつけ忘れて、辞書が辞書として使えず、あせった!!

|

« 食用にされる犬 | トップページ | 犬猫失敗話(3)--小さい犬小屋は危険 »

コメント

コメントを書く



(ウェブ上には掲載しません)




トラックバック

この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/140652/57524910

この記事へのトラックバック一覧です: Atokの辞書をAnthyの辞書に変換する:

« 食用にされる犬 | トップページ | 犬猫失敗話(3)--小さい犬小屋は危険 »