サーバーのアクセスログに特定のIPアドレスから大量のアクセスがあり、調べてみるとユーザーエージェントに Amazonbot と書かれていた。 以下のようなユーザーエージェントが使われている。
Mozilla/5.0 (Macintosh; Intel Mac OS X 10_10_1) AppleWebKit/600.2.5 (KHTML, like Gecko) Version/8.0.2 Safari/600.2.5 (Amazonbot/0.1; +https://developer.amazon.com/support/amazonbot)
私が確認したIPアドレスは以下の通り。
他にもあると思われる。
Amazonを装った偽のボットかと思いIPアドレスを逆引きしてみると 3-224-220-101.crawl.amazonbot.amazon のようにドメイン(ホスト)名が crawl.amazonbot.amazon となっており本物だった。 ユーザーエージェントに記されているURLにアクセスしてみると説明がある。
AmazonbotはAlexa(音声サービス)などAmazonのサービスを改善するために使用されているウェブクローラーとのこと。 今まで私のサイトでは目立ったアクセスがなく、その存在に気付かなかった。
また説明によると robots.txt が有効で、記述例もある。 このボットのアクセスをすべて拒否・禁止する場合、以下のように記述する。
User-agent: Amazonbot Disallow: /