/10分で読めます

Robots.txtとは?SEOとクローラーのための完全ガイド

robots.txtファイルはWebサイト内でも特に小さなファイルですが、SEOには大きな影響を与えます。1つの誤ったルールだけで、検索エンジンが重要なページをクロールできなくなることがあります。

Robots.txtとは?

Robots.txtは、Webサイトのルートに配置するテキストファイルです。検索エンジンのbotやその他の自動エージェントに、どのURLパスをクロールしてよいか、またはクロールしてはいけないかを伝えます。これはRobots Exclusion Protocol(REP)に基づいています。

重要なのは、robots.txtが制御するのはクロールであり、インデックス登録を完全に保証するものではないという点です。ブロックされたURLでも他サイトからリンクされている場合、検索エンジンはページ本文なしでURLだけをインデックスすることがあります。

Robots.txtを置く場所

このファイルは、必ず次のルートパスでアクセスできる必要があります:

https://yourdomain.com/robots.txt

たとえば/files/robots.txtのような別の場所に置くと、クローラーに無視される可能性があります。

クローラーがRobots.txtを読む仕組み

  1. クローラーはクロールを始める前に/robots.txtをリクエストします。
  2. 自分のuser-agent名に一致するルールを探します。
  3. AllowDisallowディレクティブをパスごとに適用します。
  4. 最も適切に一致するルールで許可されたURLをクロールします。

botによって対応するディレクティブが異なる場合があるため、標準でサポートされている構文を優先し、検索エンジンのツールでテストしてください。

Robots.txtの構文とディレクティブ

よく使われるディレクティブは次のとおりです:

  • User-agent: ルールブロックを適用するクローラーを指定します。
  • Disallow: 一致するパスのクロールをブロックします。
  • Allow: 特定のパスを明示的に許可します。親パスをDisallowしている場合に便利です。
  • Sitemap: XMLサイトマップのURLをクローラーに伝えます。
User-agent: *
Disallow: /admin/
Allow: /admin/help/

Sitemap: https://yourdomain.com/sitemap.xml

よくある例

1) すべて許可

User-agent: *
Disallow:

2) すべてのクロールをブロック

User-agent: *
Disallow: /

3) 内部フォルダーをブロック

User-agent: *
Disallow: /private/
Disallow: /tmp/
Disallow: /checkout/

避けるべきよくあるミス

  • 本番環境でサイト全体をブロックする: ステージング環境から公開したあと、ブロック設定を戻し忘れるケースです。
  • 機密情報をrobots.txtで隠そうとする: robots.txtは公開ファイルなので、セキュリティ対策として扱ってはいけません。
  • レンダリングに必要なJS/CSSをブロックする: 検索エンジンがページを正しく表示・理解できなくなることがあります。
  • 検索結果から除外したいのにrobots.txtを使う: インデックス除外が目的ならnoindexを使うべきです。
  • サイトマップURLを入れ忘れる: 重要なページの発見を早める助けになります。

Robots.txtとNoindexの違い

方法制御するもの向いている用途
robots.txtクロールクロール負荷の軽減、非公開に近いセクションのクロール制限
meta robots / x-robots-tagインデックス動作特定ページを検索結果に出さないこと

ベストプラクティス

  • ファイルはシンプルかつ意図が明確になるように保ちます。不要なワイルドカードや重複ルールは避けます。
  • 本当にクロールされたくないパスだけをDisallowします。
  • 大きな変更のたびに、検索エンジンのウェブマスターツールでテストします。
  • ファイルの末尾にSitemapディレクティブを追加します。
  • robots.txtの変更はバージョン管理し、ミスがあっても戻せるようにします。

Robots.txtファイルを生成する

一般的なルールテンプレートを使って有効なrobots.txtをすばやく作りたい場合は、無料ジェネレーターを使えます:

参考資料