「robots.txt によりブロックされましたが、インデックスに登録しました」とSearch Consoleに表示された時の対処方法

こんにちは、Webコンサルタントの谷藤(@go_tanifuji)です。

今回はSearch Consoleシリーズで、「robots.txt によりブロックされましたが、インデックスに登録しました」について説明します。

robots.txt によりブロックされましたが、インデックスに登録しました

「これだけ見ても、何をどうしたらいいかわからない」というお客様も多いので、参考にしていただければ幸いです。

目次

クローラを制御する「robots.txt」

robots.txtは「どのクローラに(User-agent)」「どのページを見せないようにして(Disallow)」、「どのページを見せるようにする(Allow)」というようにクローラを制御する働きをします。

robots.txtの例

「robots.txt によりブロックされましたが、インデックスに登録しました」の意味

robots.txtでブロックしているにも関わらず、なぜインデックスされてしまったかというと、他のページから内部リンク(nofollow無し)が張られているためです。

robots.txtと内部リンクの矛盾

クローラをブロックしているページでも他のサイトからリンクされていればインデックス登録が可能
Google では、robots.txt ファイルでブロックされているコンテンツをクロールまたはインデックス登録することはありませんが、ブロック対象の URL がウェブ上の他の場所からリンクされている場合、その URL を検出してインデックスに登録する可能性はあります。

●引用元:robots.txt の概要とガイド | Google 検索セントラル | Google Developers

つまり、「robots.txtでブロックしているのに、内部リンクが張られているのでクロール・インデックスできてしまっていますよ」と、Googleが警告しているんですね。

そのため「有効(警告あり)」という矛盾するような表現になっています。

Google Search Console有効(警告)

このあたりは「ウェブマスター オフィスアワー(2020 年 08 月 06 日)」でGoogleの金谷さんがわかりやすく説明してくれてます。

検索結果の状態

インデックスはされていますが、ページの中身はクロールしていないため、下記のように「このページの情報はありません」と検索結果に表示されます。

警告ページの検索結果

このメッセージは、このウェブサイトでは Google によるページ説明の作成がブロックされている一方で、Google に対してページを非表示にする設定はされていないことを意味しています。

●引用元:検索結果にページ情報が表示されない – Search Console ヘルプ  

対処方法

警告が出ているページがどうあるべきかによって対処方法は変わってきます。

インデックスさせたくない場合

非公開のコンテンツのように、インデックスさせたくないページでしたら「noindexを対象ページに入れる」か、「認証を使ってページへの匿名アクセスを禁止」するかの二択です。

ただ、noindexを入れる場合には注意が必要です。

理由はブロックしたままだと、GoogleBotがnoindexを認識できないためです。

robots.txとnoindex1

そのため、noindexを入れると同時にrobots.txtのブロックを外さなければいけません。

robots.txtとnoindex2

noindex ディレクティブが有効に機能するようにするためには、robots.txt ファイルでページをブロックせず、クローラがページにアクセスできるようにする必要があります。ページが robots.txt ファイルでブロックされるか、クローラがページにアクセスできないと、クローラは noindex ディレクティブを認識しません。

●引用元:noindex を使用して検索インデックスをブロックする | Google 検索セントラル | Google Developers

インデックスさせたい場合

そもそもインデックスさせたいのにrobots.txtでブロックしていた場合は単純で、robots.txtのブロックを解除するだけです。

具体的にはDisallowから対象ページを削除します。

robots.txtテスターで確認

robotos.txtは、記述ミスをするとSEOの影響が大きいものになります。

そのためrobots.txtテスターで想定通りの動きをしているか確認を行います。

下記のように対象URLを入力し、ブロックされていないことの確認と、エラーや警告が出ていないかを確認します。

robots.txtテスター

●参考:robots.txt テスターで robots.txt をテストする – Search Console ヘルプ

修正の検証をリクエストする

修正ができたら下記のように「修正を検証」を行い、Googleが修正内容を認識するのを待ちましょう。

修正を検証

まとめ

Google Search Consoleの「robots.txt によりブロックされましたが、インデックスに登録しました」について、発生する原因と対処方法を解説いたしました。

最後に対処方法を改めてまとめます。

  • インデックスさせたくない
    • 「noindex」を対象ページに入れて、robots.txtのブロックを解除する
    • 「認証」を使ってページへの匿名アクセスを禁止
  • インデックスさせたい場合
    • robots.txtのブロックを解除

いずれもすぐにできることですので、ぜひ試してみてください。

もし、もっとSearch Consoleを使いこなしたい場合は下記のホワイトペーパーがお勧めです。

Google Search Console実践マニュアル

サービス資料のダウンロードは下記からできます。

サービス資料ダウンロード

SEOでお困りのことがありましたら、下記から問い合わせください。

お問い合わせフォーム

では、また次の記事でお会いしましょう!

この記事を書いた人

システムエンジニアと事業経営を経てアイオイクス株式会社に入社。

インハウスとアフィリエイトでWebマーケティングを学び、現在はWebコンサルタントとして従事しています。

SEO歴:11年

【保有資格】
「中小企業診断士」

【認定試験】
米国semrush社 テクニカルSEO試験合格
米国CXL社 テクニカルSEO試験合格
米国CXL社認定Optimizer

Twitter:@go_tanifuji

目次
閉じる