今回はSearch Consoleシリーズで、「robots.txt によりブロックされましたが、インデックスに登録しました」について説明します。
「これだけ見ても、何をどうしたらいいかわからない」というお客様も多いので、参考にしていただければ幸いです。
クローラを制御する「robots.txt」
robots.txtは「どのクローラに(User-agent)」「どのページを見せないようにして(Disallow)」、「どのページを見せるようにする(Allow)」というようにクローラを制御する働きをします。
「robots.txt によりブロックされましたが、インデックスに登録しました」の意味
robots.txtでブロックしているにも関わらず、なぜインデックスされてしまったかというと、他のページから内部リンク(nofollow無し)が張られているためです。
クローラをブロックしているページでも他のサイトからリンクされていればインデックス登録が可能
●引用元:robots.txt の概要とガイド | Google 検索セントラル | Google Developers
Google では、robots.txt ファイルでブロックされているコンテンツをクロールまたはインデックス登録することはありませんが、ブロック対象の URL がウェブ上の他の場所からリンクされている場合、その URL を検出してインデックスに登録する可能性はあります。
つまり、「robots.txtでブロックしているのに、内部リンクが張られているのでクロール・インデックスできてしまっていますよ」と、Googleが警告しているんですね。
そのため「有効(警告あり)」という矛盾するような表現になっています。
このあたりは「ウェブマスター オフィスアワー(2020 年 08 月 06 日)」でGoogleの金谷さんがわかりやすく説明してくれてます。
検索結果の状態
インデックスはされていますが、ページの中身はクロールしていないため、下記のように「このページの情報はありません」と検索結果に表示されます。
このメッセージは、このウェブサイトでは Google によるページ説明の作成がブロックされている一方で、Google に対してページを非表示にする設定はされていないことを意味しています。
●引用元:検索結果にページ情報が表示されない – Search Console ヘルプ
対処方法
警告が出ているページがどうあるべきかによって対処方法は変わってきます。
インデックスさせたくない場合
非公開のコンテンツのように、インデックスさせたくないページでしたら「noindexを対象ページに入れる」か、「認証を使ってページへの匿名アクセスを禁止」するかの二択です。
ただ、noindexを入れる場合には注意が必要です。
理由はブロックしたままだと、GoogleBotがnoindexを認識できないためです。
そのため、noindexを入れると同時にrobots.txtのブロックを外さなければいけません。
noindex ディレクティブが有効に機能するようにするためには、robots.txt ファイルでページをブロックせず、クローラがページにアクセスできるようにする必要があります。ページが robots.txt ファイルでブロックされるか、クローラがページにアクセスできないと、クローラは noindex ディレクティブを認識しません。
●引用元:noindex を使用して検索インデックスをブロックする | Google 検索セントラル | Google Developers
インデックスさせたい場合
そもそもインデックスさせたいのにrobots.txtでブロックしていた場合は単純で、robots.txtのブロックを解除するだけです。
具体的にはDisallowから対象ページを削除します。
robots.txtテスターで確認
robotos.txtは、記述ミスをするとSEOの影響が大きいものになります。
そのためrobots.txtテスターで想定通りの動きをしているか確認を行います。
下記のように対象URLを入力し、ブロックされていないことの確認と、エラーや警告が出ていないかを確認します。
●参考:robots.txt テスターで robots.txt をテストする – Search Console ヘルプ
修正の検証をリクエストする
修正ができたら下記のように「修正を検証」を行い、Googleが修正内容を認識するのを待ちましょう。
まとめ
Google Search Consoleの「robots.txt によりブロックされましたが、インデックスに登録しました」について、発生する原因と対処方法を解説いたしました。
最後に対処方法を改めてまとめます。
- インデックスさせたくない
- 「noindex」を対象ページに入れて、robots.txtのブロックを解除する
- 「認証」を使ってページへの匿名アクセスを禁止
- インデックスさせたい場合
- robots.txtのブロックを解除
いずれもすぐにできることですので、ぜひ試してみてください。
アイオイクスではSEOを軸としたWebコンサルティングサービスを提供しています。
いわゆるSEOの型に沿った施策ではなく、お客様の事業やWebサイトの構成を踏まえた最適な施策のご提案を重要視しています。SEOにお困りの際はぜひご相談ください。
→SEOコンサルティング サービスページ
アイオイクスでは一緒に働く仲間を募集しています
アイオイクスのWebコンサルティング事業部では、「一緒に挑戦し、成功の物語を共有する」という理想像を掲げ、本質的な取り組みを推進しています。私たちと汎用性の高いスキルを突き詰め、自由に仕事をしていきませんか。
メールマガジンの登録はこちら
SEOに関連する記事の更新やセミナー情報をお届けします。