ポーランド語、クメール語、Indonesia (Google翻訳とYoutube Analytics)

「読んじゃいや」シリーズに近い「ネタ」なんだけどさ、ちとこの見出しだけは隠したくなくてさ。

なんの嫌がらせなのか、気付いたらこんなんなった:

ポーランド語が飛び出てくる瞬間については記憶の範囲内。ffmpeg のフィルタ名の何かに反応して、自動検出がポーランド語だと思い込んだ模様。けれど「クメール語」は気付いたらこうなってた。誰も頼んでないし、だいいち「クメール語」ってどこの言葉だ? クメールって国なのか?

「クメール王朝」として聞き覚えはあったが記憶違いではなくて、現存する国としてのクメールはないが、『クメール人(クメールじん)は、カンボジアを中心とする東南アジアの民族。 カンボジアの総人口の約90パーセントを占めるほか、タイ東北部、ラオス南部、ベトナム南部などにも住む。』。そっかそっか。でもなんで。


Google翻訳についての「評価」は何度か書いてきているが、最近気付いたこともあったので、現在進行形の評価をば。

まず『「なんか最近すんげー重いんすけど」と思ってたけど「すまんキミのせいじゃなかった」』話。chrome の extension の何かが犯人だったとおぼしき。色々外したらハングアップ頻度は減った。

二つ目は、「意味を正反対に訳す頻度が異様に高い」件。こればっかはしょうがないかとも思うんだけれど、二重否定表現を含んでいるわけでもないのに、なぜか否定表現を見失ったり勝手に否定形にしてくれたりと、やたら迷子になりやすいらしい。実例は忘れたが、基本的にこれは日常なので、原則翻訳結果は手直し前提。

三つ目。「定型」にやたら強く反応する傾向が高くてちょっと弱る。こちとら「~するくらいがいいぜっ」的な軽いニュアンスを伝えたいのだが、そうした軽い表現の英語、例えば「it is good to do so」なんぞも軒並み「~することをお勧めします」として訳出しやがる。そういや edict プロジェクトだったかで「関西弁バージョン」とかそんな変種が「喜んで」受け容れられてたなんてのがあったが、Google 翻訳でもそんなん出来ないだろうか? あとやたら「in other words」を使いたがるのも困る。

これらが最近気付いたこと。これらも含め、現在進行形での Google 翻訳に対する「評価」を改めて書いておくと:

  1. 翻訳間違いに気付けない英語力なら使っちゃダメ。6割以上の頻度で間違いを含む。
  2. 結果の英語がおかしいことに気付いたら、日本語の方を「出来るだけ細かく分割」しつつ「個々は単純に、明快に」書き直すと、望みの結果に近づくことが多い。
  3. これを数回繰り返せば概ね「7割満足」な英語にはなる。
  4. 残り3割は自力で英語を直せばよろしい。

こういう使い方が出来る人には問題ないレベルにはなってると思う。実際「日本人としてのワタシ」はやっぱり英語的発想での英文組み立ては苦手で、単語や個別表現はともかくとして「構造」の組み立てに期待して Google 翻訳をあてにしているところがある。そこに期待する程度の使い方なら、Google 翻訳は十分に優秀だと思う。

あ、ちなみにワタシは専ら「日本語→英語」のためにしか使わない。「英語→日本語」は、英訳出来た文章の正しさを確認するために逆変換してみるのに使うくらい。幸い「英語が読めない」ことは日常あんましないので。ので「英語→日本語」の評価はあんましよくわかんない。(英語が読めないことが皆無とは言わないし、まったく使わないというわけでもないけれど、それでも頻度としてはほんとに数ヶ月に一回くらいでしか「英語→日本語」では使わない。特にここ最近は翻訳プロジェクトには関わってないからさ。)


「Indonesia」の話は Google 翻訳とは全然無関係。

Youtube を「観るだけ」の人は気付いてない可能性も高いけれど、Youtube のアカウントを持っているならば、つまり Google アカウントを持っているなら、これは誰でも(凄まじく UI センスの欠ける頭のオカシイ)「Youtube Studio」を使うことが出来て、「Analytics」を参照することが出来る。ワタシは自分で明示的に頼んだ覚えはないので、たぶん「あなたも」出来るはず。無論アップロード動画がないなら見たって何も起こらないけれど。

で、この「Analytics」の「BUILD AN AUDIENCE」がなんだか痛ましいことになっていて:


「少なっ」とか言わない。「不人気チャンネル」というよりか、ワタシはここで PV 獲得を狙ってなんかいないんだから少なくたって気にするわけないし。

このね、何が気になっているのかというと、「Countryを特定出来ているのが Japan と Indonesia だけ」という事実の方なのだ。

そもそもワタシがアップロードしている動画は、「海外の人でも喜べる」ように作ってあるものがほとんどなので、海外の人が観てくれてることそのものは意図したことなわけだ。だとしたら、「英語圏の人の Country は全て特定出来ない」なのか? これ、すごく気味悪いと思わん?

この「GeometryGeography」はおそらく IP アドレスから国を絞り込む、数年前から流行り始めた例のヤツだと思う。シカケは驚くほど簡単かついい加減で、何の信頼性もなく根拠も薄いのだけれど、「これで得られる情報は100%ウソである」なんてことにはならなくて、「何割かは当たってる」(初めて見た頃の印象だと4割くらい)くらいのものだったと思う。あとほかのアクセス解析をちょっとは覗き込んだことがある経験則からは、「メリケン人はまず特定出来ない」なんてことはなく、当たり前だが U.S、U.K 比率はかなりのもんだった、はず。

だとすりゃ、ワタシの動画をみてる「Japan、Indonesia以外」はいったいどこの誰どもなのだか。「IP 詐称に長けた「わっるい」人々」だか? それともそんな道具が爆発的に流行ってる真っ最中だったりするだか? してニッポンジンとイドネシアジンだけ絶賛取り残されガラパゴってる最中だか?

まぁ「Youtube Analytics だけがダサい」説もないことはないのだけれどもね。ただ、何かが静かに起ころうとしているか、起こった、てことなのかという恐ろしい考えも捨てられず、とにかくちょい気持ち悪い。