「robots.txtによりブロックされましたが、インデックスに登録しました」とSearch Consoleに表示された時の対処方法

今回はSearch Consoleシリーズで、「robots.txt によりブロックされましたが、インデックスに登録しました」について説明します。

robots.txt によりブロックされましたが、インデックスに登録しました

「これだけ見ても、何をどうしたらいいかわからない」というお客様も多いので、参考にしていただければ幸いです。

目次

クローラを制御する「robots.txt」

robots.txtは「どのクローラに(User-agent)」「どのページを見せないようにして(Disallow)」、「どのページを見せるようにする(Allow)」というようにクローラを制御する働きをします。

robots.txtの例

「robots.txt によりブロックされましたが、インデックスに登録しました」の意味

robots.txtでブロックしているにも関わらず、なぜインデックスされてしまったかというと、他のページから内部リンク(nofollow無し)が張られているためです。

robots.txtと内部リンクの矛盾

クローラをブロックしているページでも他のサイトからリンクされていればインデックス登録が可能
Google では、robots.txt ファイルでブロックされているコンテンツをクロールまたはインデックス登録することはありませんが、ブロック対象の URL がウェブ上の他の場所からリンクされている場合、その URL を検出してインデックスに登録する可能性はあります。

●引用元:robots.txt の概要とガイド | Google 検索セントラル | Google Developers

つまり、「robots.txtでブロックしているのに、内部リンクが張られているのでクロール・インデックスできてしまっていますよ」と、Googleが警告しているんですね。

そのため「有効(警告あり)」という矛盾するような表現になっています。

Google Search Console有効(警告)

このあたりは「ウェブマスター オフィスアワー(2020 年 08 月 06 日)」でGoogleの金谷さんがわかりやすく説明してくれてます。

検索結果の状態

インデックスはされていますが、ページの中身はクロールしていないため、下記のように「このページの情報はありません」と検索結果に表示されます。

警告ページの検索結果

このメッセージは、このウェブサイトでは Google によるページ説明の作成がブロックされている一方で、Google に対してページを非表示にする設定はされていないことを意味しています。

●引用元:検索結果にページ情報が表示されない – Search Console ヘルプ  

対処方法

警告が出ているページがどうあるべきかによって対処方法は変わってきます。

インデックスさせたくない場合

非公開のコンテンツのように、インデックスさせたくないページでしたら「noindexを対象ページに入れる」か、「認証を使ってページへの匿名アクセスを禁止」するかの二択です。

ただ、noindexを入れる場合には注意が必要です。

理由はブロックしたままだと、GoogleBotがnoindexを認識できないためです。

robots.txとnoindex1

そのため、noindexを入れると同時にrobots.txtのブロックを外さなければいけません。

robots.txtとnoindex2

noindex ディレクティブが有効に機能するようにするためには、robots.txt ファイルでページをブロックせず、クローラがページにアクセスできるようにする必要があります。ページが robots.txt ファイルでブロックされるか、クローラがページにアクセスできないと、クローラは noindex ディレクティブを認識しません。

●引用元:noindex を使用して検索インデックスをブロックする | Google 検索セントラル | Google Developers

インデックスさせたい場合

そもそもインデックスさせたいのにrobots.txtでブロックしていた場合は単純で、robots.txtのブロックを解除するだけです。

具体的にはDisallowから対象ページを削除します。

robots.txtテスターで確認

robotos.txtは、記述ミスをするとSEOの影響が大きいものになります。

そのためrobots.txtテスターで想定通りの動きをしているか確認を行います。

下記のように対象URLを入力し、ブロックされていないことの確認と、エラーや警告が出ていないかを確認します。

robots.txtテスター

●参考:robots.txt テスターで robots.txt をテストする – Search Console ヘルプ

修正の検証をリクエストする

修正ができたら下記のように「修正を検証」を行い、Googleが修正内容を認識するのを待ちましょう。

修正を検証

まとめ

Google Search Consoleの「robots.txt によりブロックされましたが、インデックスに登録しました」について、発生する原因と対処方法を解説いたしました。

最後に対処方法を改めてまとめます。

  • インデックスさせたくない
    • 「noindex」を対象ページに入れて、robots.txtのブロックを解除する
    • 「認証」を使ってページへの匿名アクセスを禁止
  • インデックスさせたい場合
    • robots.txtのブロックを解除

いずれもすぐにできることですので、ぜひ試してみてください。

アイオイクスではSEOを軸としたWebコンサルティングサービスを提供しています。

いわゆるSEOの型に沿った施策ではなく、お客様の事業やWebサイトの構成を踏まえた最適な施策のご提案を重要視しています。SEOにお困りの際はぜひご相談ください。
SEOコンサルティング サービスページ

アイオイクスでは一緒に働く仲間を募集しています

アイオイクスのWebコンサルティング事業部では、「一緒に挑戦し、成功の物語を共有する」という理想像を掲げ、本質的な取り組みを推進しています。私たちと汎用性の高いスキルを突き詰め、自由に仕事をしていきませんか。

メールマガジンの登録はこちら

SEOに関連する記事の更新やセミナー情報をお届けします。

  • URLをコピーしました!
  • URLをコピーしました!

この記事を書いた人

2002年設立のSEO/CRO(コンバージョン最適化)を強みとするWebコンサルティング会社です。お問い合わせは、サービスサイト「SEO Japan」よりお願いします。

目次