「いらんこと」がかなり多くて、役に立つ部分が埋もれちゃってんのよ。
ひとつ前のを派生させて、「何をしたのかを分類して切り出す」:
*.diff のある場所に行って実行すると、差分から「ユーザ辞書用に」分類して書き出すスクリプトね。
「削除」はユーザ辞書としてはもうどうしようもないので無視するとして。
- 「add」はその名の通り、neologd 独自追加のもの。
ただし、オリジナルIPA辞書で「全角でのみ登録されてた」ものに対する「半角バージョン」もかなりの量なので注意。 - 「add_var」は恥ずかしいやつ。「高良は名前に決まってんじゃんばーかばーか」という「間違った修正」。なんだけど「ユーザ辞書」として考えるなら、「名前バージョンの高良」の追加扱いになるので、シンプルにハッピー。
- 「reading」は読み・発音の修正。これはどうもオリジナルの凡ミス修正も含まれる。
- 「cost」は、コストのみ、原形のみ、コスト+原形。コストの調整が嬉しいなら使えばいいけど、辞書の「内容」を充実させたいだけなら、不要なはず。原形についても、そのフィールドを活用する気がないならいらないはず。
22:15追記:
『「全角でのみ登録されてた」ものに対する「半角バージョン」』も分別(「add_hankaku」)するようにしてみたら、「独自追加」がほぼ限りなくゼロになってしまった。うーん、「迷惑なエントリ」って、もとから IPA 辞書に多かったってことか…。そう考えると「コストの調整」に意味が出てくるな。