マガジンのカバー画像

クローラビリティ

4
主に検索エンジンのクローラー向けの記事です。執筆はWebの間です。サイトはこちら。 https://www.web-ma.co.jp/
運営しているクリエイター

#クローラー

クローラーブロック対策、robots.txt以外でクローラーを拒否する方法(.htaccessなど)

クローラーブロック対策、robots.txt以外でクローラーを拒否する方法(.htaccessなど)

クローラーのアクセスは意外と多く、サイトによっては人間のアクセスを超える場合もあります。ちょっと具合的な数字は出しづらいのですが、弊社の管理サイトではクローラーのアクセスが人間のアクセスよりも約4倍のサイトや約9倍のサイトがあります。事業によってはそのクロールがサーバー負荷を高めるので拒否したくなりますね。まずはその方法から。

①robots.txtでクローラーを拒否する
robots.txtに

もっとみる
クロールの統計情報でGoogleクローラーのクロール数が低下したら対処が必要なのか?

クロールの統計情報でGoogleクローラーのクロール数が低下したら対処が必要なのか?

クローラーは任意のページに対して一度アクセスして終わり、という訳ではありません。毎日、または数日おきにウェブページが存在しているかどうか、ページの内容が変わっているかどうか、クロールします。場合によっては日に何度もアクセスします。これは他の検索エンジンよりも特にGoogleはその傾向があります。

特定のページに対する各クローラーのアクセス状況です。Googlebotのクロール頻度は他のクローラー

もっとみる
[SEOクローラー対策]どのクローラーがrobots.txtの指示を無視しているのか?

[SEOクローラー対策]どのクローラーがrobots.txtの指示を無視しているのか?

インターネットの世界では検索エンジンを始め、SEOツールなど多種多様な目的でクローラーが徘徊し情報を収集しています。法律の専門家ではないので正しい解釈ではないかもしれませんが、ウェブ上でクローラーがコンテンツを収集するスクレイピング自体は問題ありません。以前、某図書館の蔵書検索システムを使いやすくするためのシステムを開発した方が逮捕されるという事件もありましたが、最終的に不起訴となりました。

もっとみる