22 日目(曇り時々雨)スクレイピング強化日
0:20 就寝。二回放尿のために起き上がる。仰向けで寝ると背中が痛い。 やはりベンチで座って眠るのが体に負担をかけない最良の就寝方法だった。
6:25 起床。今日は宿の部屋の清掃日なので正午前後数時間は外出が必要だ。 部屋内の私物を片付けておく。トイレも汚れが目立つとまずいので掃除をしておきたいところだ。
6:50 なか卯昭和通り店で朝食。納豆朝定食。
月曜がゴミの日のようだ。宿に戻る途中に路上にゴミを処分。
7:20 宿の部屋に戻る。二時間くらいデスクワークができるだろう。
by 堀内正人プロ。
『神速の麻雀』第二版が気になる。鳴きの基本的な考え方をシンプルに説明しているいい本だった。- View list of files in ZIP archive on Linux - Super User
9:30 外出開始。いきなり小雨がパラパラしていて私のツキの細さを感じる。 あてがないので湯島、御徒町辺りをまずは散歩する。 ドンキとブックオフを巡るが、前者はテレビ売り場に地上波番組が映されていず、後者は厳格に立ち読みを禁止していてすぐに用事が終わる。
外神田経由で昭和通りの書泉ブックタワーに移動。ここも立ち読みが禁止されている。 陳列されている本のカバーを眺めたり、超速読を駆使したりすれば退屈しのぎにはなる。 Python 本はいろいろあるわ、Bayes の定理の基礎理論は確認できるわで満足だ。
13:00 UDX デッキで買い置きのおやつを食す。再びブックタワーで遊んで台東区に戻る。 浅草橋近傍を散策して宿に戻る。南詰の郵便局の上層階がどうなっているのかわからない。
15:05 チェックインの時刻なので、他の客と鉢合わせするのを回避しつつ部屋に戻る。 持ち歩いていた鞄から PC を出してデスクワークに復帰する。
時間が中途半端なのでスクレイピングに専念する。過去最高水準のシェルスクリプトを完成。 用途が怪しいので公開できないのが残念至極だ。 かんたんに言うと、キーワードを引数に取ってインターネット某所からそれに関係するファイルをダウンロードする。 外部の Python スクリプトを呼び出す部分を思い切ってハードコードに置き換えると可搬性が飛躍的に向上するのだが……。
- linux - How to show wget progress bar only? - Stack Overflow:
--quiet --show-progressを指定すればwgetのダウンロード進捗がワンファイルワンラインになる。
ふと幽遊白書の海藤優を思い出した。検索して時間をつぶす。
19:05 外出。雨は上がっている。
19:35 ライフ神田和泉町店で晩飯とおやつを調達。
- 海苔鮭唐揚げ弁当
- ポテチ塩
- コッペパンジャムマーガリン
店から出たら雨が再び降っている。19:45 部屋に戻る。晩飯を食いながら YouTube を観る。
:
レベルデザインが苛酷であり過ぎる。


- Index of /Tools/HTML-XML-utils
夕方のスクリプトを改良する調査と作業。試行錯誤の末 Cygwin に html-xml-utils パッケージをインストールすることに成功する。
configure; make; make install を実行するのは何年ぶりだ?
これで hxselect が動く。
bash$ hxclean toc.html | hxselect -s '\n' 'h2>a' | grep -oP "(?<=href=\").+html(?=\")" > result.txt
22:05 入浴。22:35 出浴。シャンプーとボデーソープが満タンになっていた。
麻雀の練習をする。明日でこの宿はオーラス。
