「実用を目指す一歩前」だったのが前回ので、今回のは「製品品質には程遠くともオレには割と実用」というものなのでネタの進化ではあるものの、「node.js + ejs + express + python で作る WEB サービス実例という本題」としての進化は些細なのね。しかもこれ、「Docker 向けに使うネタ」の元にするかちょっと迷ってる。いずれオレ向けに、はやるかもしれんけど、「Docker の初心者向け例」に使うにはやや複雑過ぎる気がしてて。
何かつーと「京都大学アーカイブサイトから MSM GPV をダウンロードし、これを pygrib と cartopy で(雨量予測を)可視化する」というもの。ただ cartopy が、本日時点で配布されてる linux distro で必ずしも理想の状態にはなってない(どの distro だったか、パッケージマネージャのものは相当古い)し、そもそも pygrib も cartopy も依存物の複雑さは「最初に扱うものだとするなら十分に複雑すぎる」と思うんだよね。なので、「Docker の最初のネタ」として使おうと目論んで始めたんだけれど、それは保留にして、単なるひとつ前の続きとしちゃおう、というのが今回のタイトルの真意。
「node.js + ejs + express + python で作る WEB サービス実例という本題」の差異は些細、なので、ひとつ前のと比較しながら読んでもらえればすぐにわかると思う。今回のは2つのヘビー級 pythohn スクリプトを逐次実行するようになってる。ひとつが MSM GPV のダウンロードスクリプト、もう一つがそのダウンロードした MSM GPV を入力として雨量の可視化をするスクリプト:
1 # -*- coding: utf-8 -*-
2 import io
3 import os
4 import shutil
5 import urllib.request
6 import bs4
9 _rishurlbase = "http://database.rish.kyoto-u.ac.jp/arch/jmadata/data/gpv/original"
10 _idxurltmpl = _rishurlbase + "/{utcyear}/{utcmonth:02d}/{utcday:02d}"
13 if __name__ == '__main__':
14 import argparse
15 ap = argparse.ArgumentParser()
16 ap.add_argument("year", type=int)
17 ap.add_argument("month", type=int)
18 ap.add_argument("day", type=int)
19 ap.add_argument("type", choices=["pall", "surf"])
20 ap.add_argument("--hour", type=int)
21 ap.add_argument("--fh", help="ex) 00-15")
22 ap.add_argument("--destdir", default=".")
23 args = ap.parse_args()
24 if not os.path.exists(args.destdir):
25 os.makedirs(args.destdir)
26 idxurl = _idxurltmpl.format(
27 utcyear=args.year, utcmonth=args.month, utcday=args.day)
28 ca, _ = urllib.request.urlretrieve(idxurl)
29 cont = io.open(ca, encoding="utf-8").read()
30 table = bs4.BeautifulSoup(cont, features="html.parser").table
31 for tr in table.find_all("tr"):
32 if tr.th:
33 continue
34 td = tr.find_all("td")
35 if "Parent Directory" in str(td):
36 continue
37 fn, tmdl = list(map(lambda e: e.text.strip(), td[1:-2]))
38 if "MSM_GPV" not in fn:
39 continue
40 if args.type not in fn:
41 continue
42 if args.fh and "_FH{}".format(args.fh) not in fn:
43 continue
44 if args.hour is not None and "{utcyear}{utcmonth:02d}{utcday:02d}{utchour:02d}".format(
45 utcyear=args.year, utcmonth=args.month, utcday=args.day, utchour=args.hour) not in fn:
46 continue
47 print(fn, "...", end="", flush=True)
48 if not os.path.exists(fn):
49 gpvtmpfn, _ = urllib.request.urlretrieve(idxurl + "/" + fn)
50 shutil.move(gpvtmpfn, os.path.join(args.destdir, fn))
51 print("done.", flush=True)
1 # -*- coding: utf-8 -*-
2 import os
3 import sys
4 import datetime
6 import pygrib
7 import numpy as np
8 import matplotlib.pyplot as plt
9 from matplotlib.colors import BoundaryNorm, ListedColormap
10 import cartopy.crs as ccrs
11 from cartopy.io.img_tiles import GoogleTiles
14 def _read(srcfn):
15 src = pygrib.open(srcfn)
16 for s in src:
17 yield (s.name, s.parameterName), s.validDate, s.latlons(), s.values
18 src.close()
21 def main(gpv, destdir="."):
22 if not os.path.exists(destdir):
23 os.makedirs(destdir)
24 key = "Total precipitation"
25 _alldata = {}
26 (lats, lons) = None, None
27 for yk, vd, latlons, values in _read(gpv):
28 (lats, lons) = latlons
29 if key in yk:
30 print(vd, flush=True)
31 _alldata[vd] = values
32 if lats is None:
33 sys.exit(0)
34 X, Y = lons[0,:], lats[:,0]
35 #
36 # NHK方式の [0, 1, 5, 10, 20, 30, 50, 80]
37 cmap = ListedColormap(
38 ['white', 'cyan', 'skyblue', 'blue', 'yellow', 'orange', 'red', 'magenta'])
39 clip_min = 0.1
40 norm = BoundaryNorm(
41 [clip_min, 1, 5, 10, 20, 30, 50, 80], cmap.N, extend="max")
42 #
43 tocho = (139.691717, 35.689568)
44 #
45 tiler = GoogleTiles(style='satellite')
46 for vd in _alldata.keys():
47 outname = "{}_{}.png".format(
48 key,
49 str(vd).partition(":")[0].replace(" ", "_"))
50 outname = os.path.join(destdir, outname)
51 if os.path.exists(outname):
52 continue
53 fig = plt.figure()
54 fig.set_size_inches(16.53 * 1.5, 11.69)
55 ax = fig.add_subplot(projection=tiler.crs)
56 ext = [tocho[0] - 8, tocho[0] + 3, tocho[1] - 5, tocho[1] + 5]
57 ax.add_image(tiler, 6)
58 ax.set_extent(ext, ccrs.PlateCarree())
59 v = _alldata[vd].copy()
60 v[np.where(v < clip_min)] = np.nan
61 CS = ax.pcolormesh(
62 X, Y, v,
63 norm=norm,
64 transform=ccrs.PlateCarree(),
65 shading="auto",
66 cmap=cmap, alpha=0.7)
68 ax.coastlines(resolution="10m")
69 ax.gridlines()
70 plt.colorbar(CS, ax=ax)
71 ax.set_title("{} on {} JST\n(v[np.where(v < {})] = np.nan)".format(
72 key, str(vd + datetime.timedelta(hours=9)), clip_min))
74 plt.savefig(outname, bbox_inches="tight")
75 plt.close(fig)
76 print(outname, flush=True)
79 if __name__ == '__main__':
80 # 入力は "Z__C_RJTD_20210520030000_MSM_GPV_Rjp_Lsurf_FH34-39_grib2.bin" など。
81 import argparse
82 ap = argparse.ArgumentParser()
83 ap.add_argument("gpv")
84 ap.add_argument("--destdir", default=".")
85 args = ap.parse_args()
86 main(args.gpv, args.destdir)
ともに単独で十分実用になる(が言い過ぎなら実用とする元ネタになりうる)スクリプトだが、京大のアーカイブページの構造、ファイル名の規則についての知識は不可欠の「知ってる人向け」になってる。例えば初期値時刻としてありえないものを要求すれば単に 404 になるだけだが、スクリプトはそれを防ごうとしてない。(FH についても同じだし、そもそも「13月」という誤った指定すらスクリプトそのものは許容する。)
1 'use strict';
3 var listenport = parseInt(process.argv[2], 10) || 8080;
4 var fs = require('fs');
5 var ejs = require('ejs');
6 var express = require('express');
7 var path = require('path');
8 var url = require('url');
9 var app = module.exports = express();
10 //const querystring = require('querystring');
11 const subprocess = require('child_process');
12 const mime = require('mime-types');
14 app.engine('.html', ejs.__express);
15 app.set('views', path.join(__dirname, 'views'));
16 app.set('view engine', 'html');
18 //
19 app.get("/:year/:month/:day/:hour/:fh/Total%20precipitation", (req, res) => {
20 console.log(req.url);
21 const p = req.params;
22 const year = `${String(parseInt(p.year)).padStart(4, '0')}`;
23 const month = `${String(parseInt(p.month)).padStart(2, '0')}`;
24 const day = `${String(parseInt(p.day)).padStart(2, '0')}`;
25 const hour = `${String(parseInt(p.hour)).padStart(2, '0')}`;
26 const fh = `${p.fh}`;
27 const resfile = `${year}${month}${day}${hour}-${fh}.json`;
28 res.render("result.html", {resfile: "/" + resfile});
30 // download MSM GPV
31 const py1res = subprocess.spawn("py", [
32 "dljmamsmgpv.py",
33 year, month, day, "surf",
34 `--hour=${hour}`, `--fh=${fh}`,
35 "--destdir=_gpv_rawdata",
36 ]);
37 const gpvfn =
38 `_gpv_rawdata/Z__C_RJTD_${year}${month}${day}${hour}0000_MSM_GPV_Rjp_Lsurf_FH${fh}_grib2.bin`;
39 console.log(gpvfn);
40 const imgdir = `_result_imgs/${year}${month}${day}${hour}-${fh}/Total precipitation`;
41 py1res.stdout.on("data", (data) => { console.log(data.toString()); });
42 py1res.stderr.on("data", (data) => { console.log(data.toString()); });
43 py1res.on("close", (code) => {
44 console.log(`dljmamsmgpv.py exited(${code}).`);
46 // visualize
47 const py2res = subprocess.spawn("py", [
48 "percip_viz.py",
49 gpvfn,
50 `--destdir=${imgdir}`,
51 ]);
52 py2res.stdout.on("data", (data) => { console.log(data.toString()); });
53 py2res.stderr.on("data", (data) => { console.log(data.toString()); });
54 py2res.on("close", (code2) => {
55 console.log(`percip_viz.py exited(${code2}).`);
56 fs.readdir(imgdir, (err, files) => {
57 let reslist = [];
58 for (const f of files) {
59 reslist.push({img: "/" + imgdir + "/" + f});
60 }
61 fs.writeFile(resfile, JSON.stringify(reslist), (err) => {});
62 });
63 });
64 });
65 });
66 app.get("*", (req, res) => {
67 console.log(`GET ${req.url}`);
68 fs.readFile(
69 "." + decodeURI(url.parse(req.url, true).pathname), function(err, data) {
70 if (!err) {
71 res.writeHead(200, {'Content-Type': mime.lookup(req.url)});
72 res.write(data);
73 } else {
74 console.log(err);
75 res.writeHead(404, {'Content-Type': 'text/html'});
76 res.write("Not Found.");
77 }
78 return res.end();
79 });
80 });
82 /* istanbul ignore next */
83 if (!module.parent) {
84 app.listen(listenport);
85 console.log('Express started on port ' + listenport);
86 }
1 <!DOCTYPE html>
2 <html>
3 <head>
4 <script src="https://ajax.googleapis.com/ajax/libs/jquery/3.6.0/jquery.min.js"></script>
5 <link
6 href="https://cdnjs.cloudflare.com/ajax/libs/tabulator/5.2.2/css/tabulator_site.min.css"
7 rel="stylesheet">
8 <script
9 type="text/javascript"
10 src="https://cdnjs.cloudflare.com/ajax/libs/tabulator/5.2.2/js/tabulator.min.js">
11 </script>
12 <script>
13 var timerId = null;
14 var table = null;
15 function waitData() {
16 let datapath = "<%= resfile %>";
17 $.ajax(
18 {
19 url: datapath,
20 success: function(result) {
21 console.log(result);
22 table.setData(result);
23 clearInterval(timerId);
24 },
25 error: function(xhr) {
26 console.log(xhr);
27 if (!timerId) {
28 timerId = setInterval(waitData, 1000);
29 }
30 }
31 });
32 }
33 function setupPlaylist() {
34 table = new Tabulator("#playlist", {
35 "selectable": 1,
36 "columns": [
37 {
38 "field": "img",
39 "title": "img",
40 "formatter": "image",
41 "formatterParams": {"width": 52, "height": 26},
42 },
43 ]
44 });
45 table.on("tableBuilt", function () {
46 waitData();
47 });
48 table.on("rowSelected", function (row) {
49 $('#selimg').html(`<img src="${row.getData().img}" height="540"/>`);
50 });
51 }
52 $(document).ready(setupPlaylist);
53 </script>
54 </head>
55 <body>
56 <table border=0>
57 <tr>
58 <td>
59 <div id="playlist" style="max-width: 20em"></div>
60 </td>
61 <td>
62 <div id="selimg"></div>
63 </td>
64 </tr>
65 </table>
66 </body>
67 </html>
serv.js と result.html、特に後者の前回からの代わり映えのなさよ。そう、結局 python 部分が「一応ちゃんと目的のことをする複雑なものになった」だけがほとんど全て。
「node.js + ejs + express + python で作る WEB サービス実例という本題の些細な差異」はハイライトした行。画像が「/2022/5/21/0/00-15/Total%20precipitation」をリクエストしてて、serv.js はこれを「/:year/:month/:day/:hour/:fh/Total%20precipitation」でルーティング。「:year」で「req.params.year」を取れる、てことね。(なお、Express 公式サイトの実例集にはこのパラメータ取得部分のもう少し凝った例があるので読んでおくと良い。)あと細かいけど「ファイル名に空白を含む」ケースね、これ。decodeURI が必要になったのはそれが理由。
にしても塩梅が難しい。pygrib、cartopy ともに「Windows だととても大変」なものなので「Docker でハッピーさ」のネタとして楽しいものになりうるのは確かなのだけれど、ワタシが今目指してるのは「単純すぎず複雑過ぎず、なおかつ嘘くささのないちゃんとした「使える」実例」なので…。「複雑過ぎず」になるならないのが既にわかっちゃってるんだよなぁこれ。(最低でも linux distro によってはパッケージマネージャを利用しない構築になりうることがわかってる。)
今回のはだから、ワタシのサイトに真面目に追従して頑張ってる人か Windows ユーザ以外にとっては割とそのまま簡単に(「py」問題を措置する程度で)動かせるんだけれど、そうでない人が今からこれを動かすようにするのは、おそらく数日がかりの作業になるほど大変なんだよね。
padStart は割と最近の ECMASCRIPT で使えるようになった新しい機能。だからこれの使用を避ける動機はわかるだろう。けど、ワタシが避けたネタと避けてない今回のネタでの違いは? これが「同じ javascript だけど、プロセッサがブラウザかサーバサイド node.js かの違い」によるものね。ブラウザは「無限にある」と考えればコントロール出来ず、「サーバはオレのもの」(レンタルサーバなどによる制約を除けば)なのでコントロール下にある、の違いね。「ユーザが古いブラウザを使ってるかもしれない」ということに備える必要があっても、「使う node.js はコントロール出来る/または使ってる node.js を把握してる」てこと。