QuerySeekerSpiderのアクセスは弾くことにした
avatar

サーバのログは毎朝メールで届くようにしているのだけど、不定期に大量の変なアクセスが来ていたことは知っていて不思議に思っていた。

恐らくはブログの各ページを収集するボットだろうとは思っていたけど、404 エラーとして以下のような内容のメールが届く。

収集しようとするファイルの末尾に必ず “\x5c” という文字列が入るので、404エラーになるのは当たり前。必ず2回アクセスされるのは、こちら側がリバースプロクシ設定しているから。

不定期とはいえアクセスの度に各エントリファイルの末尾に勝手に文字列加えてアクセスされても困るわけで、やっとこaccess.logをチェックする気になった。それで結論なのだけど、User Agentが『QuerySeekerSpider』というクローラのアクセスであることが判明したわけです。

というわけで、nginxアクセス制限用の設定ファイルを作った。nginxをインストールしたらサンプルとしてdeny_f.txtというファイルがあるので、それを参考にしています。

上記deny.confを保存したら、nginx.confに読み込ませる設定を記述する。if文を利用した判定はseverかlocation内に記述しなければならないので注意。

nginx.confのチェックをして問題なければnginxの再起動。あとはブラウザでUser Agentを変更してアクセス。403エラー表示されたら成功。

はてなブックマーク - QuerySeekerSpiderのアクセスは弾くことにした
Pocket

関連してるかもしれないエントリ

dullahan

About dullahan

[ 猫 ] [ 料理 ] [ 飲んだくれ ] [ いい加減 ] Web 広告関連とかもしてるフリーランス。寝だめするわビール飲むわうるさいわ黙れ。メアド等の情報は About に。家族の猫は『あげ&まろ』だもの。飲み会予約するなら前日までに。
This entry was posted in nginx, ネット and tagged , , , . Bookmark the permalink.

Comments are closed.