エントリー

Baiduspiderをアクセス拒否

自宅サーバーのアクセスログを眺めていると、特定のホストからのアクセスが非常に多いです。そのアクセスのユーザーエージェントに Baiduspider という文字があったので調べてみたら…、「百度」という中国の検索サイトのクローラーのようです。

以前はこのクローラーからのアクセスが異常に多く、その負荷が問題になるほどだったので、色々なサイトがアクセス拒否の対策をとったらしい。

今は負荷が問題になるほどのアクセスではないけど、中国向けの情報は配信していないので、robots.txt に以下の記述を追加しておきました。

User-agent: baiduspider
Disallow: /

これでクローラーを拒否できるらしい。しばらく様子見。

ページ移動

コメント

  • コメントはまだありません。

コメント登録

  • コメントを入力してください。
登録フォーム
名前
メールアドレス
URL
コメント
閲覧制限
投稿キー(スパム対策に、投稿キー を半角で入力してください。)

ユーティリティ

2012年02月

- - - 1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 - - -

カテゴリー

キーワード検索

キーワード検索フォーム
キーワード

Feed

利用ツール