Python 翻訳の話。
「あと少しで 100% になるもの」を一気に書き上げてしまうか、翻訳達成率が異様に低いものでそれなりに需要がありそうなものを「ちょびっとずつ」という基準で翻訳対象を選んでるんだけど、その前者にあたる base64 モジュールがね、残ってるのが ASCII85、BASE85 なの。
なんだけどさ、このリファレンス、「ASCII85、BASE85 の内容理解せずに」は日本語だろうが英語だろうがわからない、と思うんだな。ワタシもこれまで知らなかったエンコードだけど、今英語の Wikipedia 読んで理解した。理解出来てしまえば簡単なエンコードで、何も悩むことはないんだけれどねぇ。
初見で(懐かしの)uu エンコードそのものだなこれは、と思った。uu はエンドユーザだったことしかないので、仕組みまで理解したことはないけれどね。
それよりこれ、結構歴史あんだな。PostScript、PDF に使われてんのね。知らなかったよ。
どう簡単なのかは WikiPedia 読んで。乱暴に要約すれば(オリジナルバージョンは)、
入力の 4バイト(32bit)
⇒
“!”から”u” までの 85 文字で構成する「85進数」x 5
⇒
“!”から”u” までの 85 文字で構成する「85進数」x 5
なので膨張率は 5/4。base64 (6/4)より無論小さい。丁寧に要約に微かに付け加えれば「これの変種がいくつか」てこと。Python 3.4 のリファレンスが説明するのはこの変種の部分な。「”u”まで」なので、v~z は空いておるでしょう? z はエンコード後のオールゼロ(!!!!!)、y はエンコード前のオール4つの連続するスペース(0x20202020)として使ったり使わなかったり。これしか説明しないのよ、原文も。だから翻訳したところでおんなじ。
「訳すつもりはない」と宣言してるつもりはないよ。けどさ、なんか訳す甲斐ないなぁ、と思ってな。