フォロー

どうでも良いけどインデックス拒否はrobots.txtの内容を見て検索サービスのインデックスを登録するか否か?というものなので、行儀の悪い検索サービスならrobots.txtは無視する

当然ながら個人が作ったようなクローラボットはrobots.txtを読む理由に乏しいので個人が情報収集することまで拒否するのが難しい

更にはおそらくインデックス拒否していないアカウントによるブースト(リツイート)まで判定していないと思われるので、ブーストされた投稿はインデックスに登録される

言ってみればWeb上のrobots.txtによる検索サービスインデックス登録は単なる慣例であって、クローリングする側の配慮によって成立している慣例なので何ら強制力がないものです

· · SubwayTooter · 0 · 1 · 3
ログインして会話に参加
グルドン

Mastodon は、オープンなウェブプロトコルを採用した、自由でオープンソースなソーシャルネットワークです。電子メールのような分散型の仕組みを採っています。