どうせ和布蕪るなら、続き (jumandic 相手に貧乏性、の軽くな説明1)

昨晩は眠くて何の説明もしなかったので。

興味ある人は mecab_userdic_from_jumandic-20191118.tar.bz2 を見ながら読んでな。

にしてもアレだ。結構時間かけてやってたもんで、コメントが実情と違ってたりすんのな。改めて冷静に見直すと結構ヒドい。ともあれ。

ことの性質的に、「やりたいことは至って単純明快」「だけれどもその実現はかなり繊細で複雑」「なのにも関わらず技術的におもしろいネタは極めて少ない」という内容だもんで、ワタシのこのブログで書くネタとして、「やってやりましたぞ」以上のものってほとんどないわけなのよ。コメント内で「スクリプトというよりはワタシの作業記録である」と言ってるのは、こうした性質も踏まえている。

それでもなお、むりくりネタを抽出することもまぁ、さすがにこの量だからね、ないわけではなくて。いくつか、個人的にやってて面白かったことを書いておこうかと。話は長くなるので、そのいくつかの、今回はひとつだけ。


「やってて面白かった」と言っておきながら、「やらなかった面白かったこと」から。

面白いというかさ、「興味深い」かな。日本語についてちょっとは深く考えてみるいい機会になった、てことね。

「タル形容詞」の話についてはここで書いた。そもそもが、副詞だの形容詞だの形容動詞だの、学校で習ったのはもう何十年も前なんだもの、思い出すのに苦労しながらやってたわけだけれど、思い出すというだけではないわけね、jumandic は「学校で習ったソレ」とは違う文法で日本語を扱っているわけだから。その「タル形容詞」「ナ・ナノ形容詞」以外でちょっと気になってたものがあったの。こんな子たち:

オリジナルと少し違う。スクリプトの「1st」プリプロセス結果。
1 うわべ,うわべ,うわべ,1133,1133,11823,名詞,普通名詞,*,*,ウワベ,修飾(デ格)
2 お陰,おかげ,おかげ,1133,1133,12290,名詞,普通名詞,*,*,オカゲ,修飾(デ格)
3 きっかけ,きっかけ,きっかけ,1133,1133,11813,名詞,普通名詞,*,*,キッカケ,〜を〜に構成語 修飾(デ格)
4 したり顔,したりがお,したりがお,1125,1125,10567,名詞,サ変名詞,*,*,シタリガオ,修飾(ニ格) 修飾(デ格)
5 それなり,それなり,それなり,1133,1133,10218,名詞,普通名詞,*,*,ソレナリ,修飾(ニ格)
オリジナルと少し違う。スクリプトの「1st」プリプロセス結果。
1 すぐ,すぐ,すぐ,35,35,7566,副詞,*,*,*,スグ,相対名詞修飾 修飾(ニ格)
2 そのまま,そのまま,そのまま,35,35,5552,副詞,*,*,*,ソノママ,数量修飾 〜を〜に構成語 修飾(ニ格) 修飾(デ格)
3 たっぷり,たっぷり,たっぷり,35,35,7090,副詞,*,*,*,タップリ,数量修飾 修飾(ニ格) 修飾(ト格)
4 なかなか,なかなか,なかなか,35,35,6466,副詞,*,*,*,ナカナカ,修飾(ニ格)

この「~格」は、ほぼ読んだままの理解をひとまずすればいい。「なかなか」であれば、「なかなかに」という形での修飾語となりうる、て意味。で、こうした語を、機械処理のためのパーツにするためにどういう戦略を取れば良いのか、と、まぁこういうことになるわけだね。jumandic はご覧の通りに「補足事項」の形での単なるメモ。ipadic もこれはほとんど同じだけれど、それこそ「名詞,副詞可能」といった分類を使って区別しているわけだ。

そう。「いやいや待てよ」。辞書エントリとしてね、「なかなか」という副詞を登録するところまではいい。じゃぁ、「なかなかに」となりうることがわかっているのならば、「なかなかに」という副詞を登録すればいいではないか。ほんと? 「なかなかに」の「に」は助詞なのだから、「なかなかに」はいらんではないか。ほんと? これってのはつまり、まずは「国文法解釈としてどこまで分解するか」というアカデミックな側面と、「「なかなかに」単独でも存分に副詞やろ」という実用面を強調した側面との衝突なわけなんだよ、これは。実際 MeCab に解析させたときに「なかなか(副詞) + に(助詞)」と分解されることが「うれしいのか」となった場合に、言語学・国語学そのものに興味がない人にとっては、正直嬉しくないはずなんだよね。「なかなかに」というパーツとして切り出された方が「便利」と感じるであろうと。

じゃぁ、と。「うれしいだろ?」に従って、「(デ格)」を見つけたら「○○」とともに「○○で」ももろとも投入してやろうか、と考えたとする。実際考えた。だ、けれども。この「デ格・ニ格・ト格」コメントが付いてるやつら全体を眺めてるとね、「あー、やっぱ日本語ってむつかしいなぁ」と思い知らされるハメになるわけ。「なかなか」に対して「ニ格」はまぁ腑に落ちるかなと思うんだけれど、「たっぷり」を見て欲しい。「たっぷりに/たっぷりと」、うん、いい。「たっぷりで」。何がダメなの? そう、jumandic が与えている「格」はあくまでも「標準的にはよくくっつくもの」を代表として与えているだけであって、「それなりと」が日本語としてありえないことは示してないわけなのよ。これ考え出したらやっぱり「名詞/副詞 + 助詞」でいい、面倒だし、となった、てわけ。(ついでに言えば、「これやり出すとキリがない」てのもある。辞書エントリの肥大につながる、てわけだ。)

実際 ipadic でも「ニ格・デ格・ト格」相当になるものを、「~ニ、~デ、~ト」な副詞として登録しているか、語幹の方を名詞や副詞として登録しているかどうかはマチマチで、いたりいなかったりする。よく使われ、それでしか使われない語なら、当然そうする合理的な理由となる、てことだろう。(ト格なら「忽然と」とか「きちんと」とかがそうだね。ニ格なら「ほどほど」。)

「形容動詞ってなんぞ」を Wikipedia で読んで理解してみていたときも感じていたことなんだけれど、やっぱ自然言語って面白いんだよね。スクリプト内では「適用対象のフォーマル度/カジュアル度」という言い方をしているけれど、実際は「時代性」というものも大いに関係していて、なんせ言語は「使われて育つ」からね、たった20年程度でも変わってきた日本語は結構思い当たるものでも多い。この「デ格、ト格、ニ格」に関してなんぞも、割と「ネット社会」になって、フリーダム度が加速した実感がある。昔なら「間違った日本語」として指摘されたであろう使い方でも、今なら普通に許容されている。

「たった20年程度でも変わってきた日本語」で真っ先に思いつくのはやっぱり「よろしかったでしょうか」であろうか。これ、私が大学生だった二十数年前は「北海道方言」だったんだよね。本州から北海道に渡ったワタシにとって、コンビニなどでいちいち発せられるこの「似非丁寧語」は、「気になる間違った日本語」だった。状況が変わってきたのは、ワタシが北海道を離れた後である。テレビでも取り上げられたので、聞いたことがある人もいるかもしれないけれど、なんと、この「よろしかったでしょうか」が、本州に輸入されることとなった。主犯は、北海道拠点のある有名居酒屋チェーンである。このマニュアルに書かれてたとかなのかな。気付いたら「よろしかったでしょうか」を本州でもよく聞くようになった。(最近また聞かなくなってきた気もするけれど、ただ、昔ほど違和感感じる人は少なくなってるのは確か。)

そして。時代性以外の側面もある。

「桃井はるこだったろう」についてなんだけどさ。これね、実は文法解釈って、「話し手目線で変わる」って考えたことある? ちょっと前に紹介した「【対論】言語学が輝いていた時代」でこれについてちょっと言及があって、実際そういう理論を提唱している学者もいるんだそうだ。コセリウ、カール・フォスラー、かな?

ワタシは「桃井はるこだったろう」をいちいち形容詞として登録する価値はない、と言った。けれども、こんなテキストを考えてみて欲しい:

お前ってほんと、桃井はるこな。

何をどう形容したくて話し手が桃井はるこを使ったのかは定かではないにせよ、少なくともこの話し手は、「桃井はるこ(固有名詞,人名)」という文法を適用しているわけではなく、そう、「形容」しているわけだ。なんだ、形容詞じゃん。ちゃんちゃん。

まぁ、MeCab のようなシステムの辞書に「桃井はるこ」を形容詞として(あるいは形容動詞語幹として)登録する価値は相変わらずないわけだけれど、日常使っている自然言語としての日本語は、暗黙にこうした構造を内蔵している、てことだよ。細かいことをいえば、歴史的には「-tick」の和訳的に「的」が爆発的に使われた経緯がまずあり、その「的」すら落として「的な」的な意味にする、という変化があることは確か。挙げた例は、なので「桃井はるこ的だな」の省略形という解釈は成り立つ。

これはどう?:

そんなに桃井はるこがってると、猫耳るぞ!

そう。ここでは「桃井はるこ」は形容詞(ガル接続)、「猫耳」は動詞である。こうなってくるともはや「辞書」という考え方そのものを考え直す必要が出てくるね。各々の語は「品詞」としてくくられるものではなくて、テキストの構造依存である、てことね。「動詞が収まるべき位置にあるから動詞だ」てわけだ。(なので「詞」という概念がそもそも疑わしい、てことだ。)

副詞にもなるだろうか?:

  • その猫は、桃井はるこく走り去った。
  • のっちくなれよ。

そういえば、話が面白い人、てのは、こういう変形が巧みだったりするよね。お笑い芸人なんてのは、要するにこういうヘンな日本語のプロだ、てことだわね。


うん、「あなたにとって面白い」かどうかはともかくとして。ワタシは色々脳内議論が活発になって、非常に面白かったのよ。おぬしはみーつーか?

ほかのネタについては改めて。


追記:
あげてしまったあとすぐに気付いた。これ:

  • その猫は、桃井はるこく走り去った。
  • のっちくなれよ。

副詞じゃないよね。これは形容詞。にしても、「のっちくなる」って、どんなだろうか。



Related Posts