**Keᷟiͣzᷤoͭuͦ@6ͩ4ͦ0ᷠ0** @keizou@mstdn.guru · 2020-01-29T02:40:01Z

Keᷟiͣzᷤoͭuͦ@6ͩ4ͦ0ᷠ0 @keizou@mstdn.guru

自作Webクローラはwget使えば再帰的に掘ってくれる機能がもともとあるんで自分で作ってみりゃあ良いんじゃないかなって思う

ただクローラにはIT業界で慣習的なマナー・エチケットみたいなもんがあるんで下記の情報は読んでおくべき

robots.txtやメタタグについての情報が読める

Librahack事件については下記が行が重要

> このクローラは、同時には一回しかリクエストを送らず(以下略)

上記を読んで接続先に合わせた常識的なクローリングをしよう

2020年01月29日 02:40 · · SubwayTooter · · ·