Google Search Consoleで「sitemap.xmlのミス」を見つける方法

Googleサーチコンソールでsitemap.xmlのミスをみつける

こんにちは、Webコンサルタントの谷藤(@go_tanifuji)です。

前回の「Google Search Consoleで「SSL化のミス」を見つける方法」に引き続きGoogle Search Consoleをテーマにお話しします。

今回は「sitemap.xml」についてです。※参考:サイトマップ

「地味・・・」と思われがちですが、SEOにおいてsitemap.xmlは重要です。

なぜなら、サイト順位の下落やトラフィックの減少を引き起こす要因になるためです。

それにも関わらず、私が担当してきたサイトの約8割がsitemap.xmlのミスをそのままにしていました。

もしかすると、あなたが運営しているサイトも同じことが起きているかもしれませんので、ぜひこの記事を参考にしてみてください。

sitemap.xmlとは?

下記のようなURLの一覧で、Googleにページの存在を伝えることでクロールを助ける役割があります。

sitemap.xml

 

sitemap.xmlに記載すべきURL

sitemap.xmlには、「インデックスさせたいURL(正規URL)」を記載します。

サイトマップを使用する場合、サイトマップでは正規 URL のみを指定します。

●引用元:重複した URL を統合する – Search Console ヘルプ

そのため、逆に「インデックスさせたくないURL(非正規URL)」を記載すべきではありません。

例えば下記のようなURLです。

これらを記載すると、SEOにおいて下記のような悪影響が出る可能性があります。

  • 非正規URLが正規URLとして扱われてしまう
  • インデックスすべきでないURLにクローラが多く回り、重要なURLへクローラが来ない、もしくはクロール頻度が落ちる

そのためsitemap.xmlを正しく記載することはSEOにおいて重要です。

では次に、sitemap.xmlのミスの見つけ方の手順を解説していきます。

sitemap.xmlのミスの見つけ方

手順①:「すべての送信済みページ」を選択

Google Search Consoleに表示されるURLがどのように検出されているのかというと、「sitemap.xmlで送信されたURL」と「Googleが独自に抽出したURL」の2つです。

デフォルトではすべてのデータ(すべての既知のページ)が表示されていますが、下記のように見たいURLだけを選択して見ることができます。

sitemap.xmlで送信されたURL

今回は「sitemap.xml」のミスを見つけることが目的なので、「すべての送信済みページ」を選択してください。

手順②:「カバレッジ > エラー」の確認

カバレッジのエラーを選択して、「詳細」に出ている内容を確認してください。

Google Search Consoleのカバレッジのエラー

エラーの詳細ごとに対処方法を説明していきます。

送信された URL に noindex タグが追加されています

先述しました通り、noindexが入っているページはsitemap.xmlに記載すべきではありません。

「今後もnoindexを入れるべきURL」でしたらsitemap.xmlから削除して下さい。

「noindexを入れるべきではないURL」でしたら、noindexを外しましょう。

修正が終わりましたら「修正を検証」を選択し、Googleが認識するのを待ちます。

Google Search Consoleの検証

これ以降の項目も、修正後は「修正を検証」を行ってください。

送信された URL が robots.txt によってブロックされました

robots.txtでブロックすべきURLかどうか確認してください。

「ブロックすべきURL」ならsitemap.xmlから削除、「ブロックすべきでないURL」でしたら、robots.txtのブロックを解除してください。

送信された URL が見つかりませんでした(404)

「削除されたURL」である場合はsitemap.xmlから削除してください。

「URLの記載ミス」の場合は、正しいURLに修正しましょう。

送信された URL はソフト 404 エラーのようです

ページが存在しない場合、本来であればステータスコード404(未検出)を返す必要があります。
しかし存在しないにも関わらずステータスコード200(正常)を返してしまうケースがあり、これを「ソフト404」といいます。

ステータスコード200が返されると、GoogleはそのURLにページが存在するものと判断し、インデックスしてしまうケースがあります。

ソフト404

そのためステータスコードを「200」から「404」に変更し、sitemap.xmlから削除して下さい。

手順③:「カバレッジ > 除外」の確認

カバレッジの「除外」を選択して、「詳細」に出ている内容を確認してください。

ちなみに除外とは「エラー以外のなんらかの理由でインデックスに登録できない」ことを表しています。

いくつか項目がありますが、今回は「重複しています。送信された URL が正規 URL として選択されていません」に注目してください。

カバレッジ(除外)

重複しています。送信された URL が正規 URL として選択されていません

このメッセージが表示されるときは、sitemap.xmlの中に下記の2つが記載されている可能性が高いです。

  • リダイレクト元のURL
  • canonical元のURL

実際にページを開いてみて、「リダイレクトされていないか?」「canonicalが入っていないか?」を確認してみてください。

確認の際に役に立つツール

リダイレクトを確認する際には、Chromeの拡張機能の「Redirect Path」がおすすめです。

下記のようにビジュアル的にリダイレクトの過程が見れるので、私はよく使用しています。

リダイレクトパス

●参考:Redirect Path – Chrome ウェブストア

またcanonicalのチェックでしたら、Chromeの拡張機能の「SEOTagViewer」がおすすめです。

下記のように開いているページの右下に、canonicalで指定しているURLが表示されます。

SEOTagViewer

●参考:SEOTagViewer – Chrome ウェブストア

sitemap.xmlの必要性

「sitemap.xmlが必要なサイト」は下記のものだとGoogleはいっています。

  • サイトのサイズが非常に大きい
  • サイトにどこからもリンクされていない、または適切にリンクされていないコンテンツ ページのアーカイブが大量にある
  • サイトが新しく、外部からのリンクが少ない
  • サイトに動画や画像などのリッチメディア コンテンツが多数含まれている、またはサイトが Google ニュースに表示されている

●引用元:サイトマップについて – Search Console ヘルプ

逆に「sitemap.xmlが必要ではないサイト」は下記のとおりです。

  • サイトのサイズが「小さい」
  • シンプルなサイト ホスティング サービスを利用している
  • サイトはサイト内で完全にリンクされている
  • メディア ファイル (動画、画像)またはニュースページが多くない

●引用元:サイトマップについて – Search Console ヘルプ

そのためsitemap.xmlを正しい形に維持し続けることが困難で、「sitemap.xmlが必要でないサイト」にあなたのサイトが当てはまるのであれば、sitemap.xmlを削除することも一つの選択肢です

「sitemap.xmlを削除したら、SEOに悪影響を及ぼすのではないか?」という心配をされるお客様もいらっしゃいますが、実際に削除して順位が下がったり、トラフィックが下がったりしたケースは1件もありませんでした。

Googleのクロール技術は、昔とは比較にならないくらい高度なものになっているため、安心して削除して下さい。

サイトの各ページが適切にリンクされていれば、Google は通常、サイトのほとんどのページを検出できます

●引用元:サイトマップについて – Search Console ヘルプ 

まとめ

sitemap.xmlはSEOにおいて重要である一方で、正しい形に維持し続ける必要があります。

あなたのサイトが「sitemap.xmlが必要なサイト」であれば、今回ご紹介した方法で定期的にメンテナンスを続けてください。

逆に「sitemap.xmlが必要でないサイト」であれば、削除することを検討してみてください。

最後まで読んでいただき、ありがとうございました。

ではまた次の記事でお会いしましょう!


無料サイト診断サービスを行っています

アイオイクス株式会社では、Webサイトの無料診断を行っております。

弊社のコンサルタントがSEO・CRO(コンバージョン改善)の観点から御社のWebサイトを分析し、改善案を提案させていただきます。

もし興味がございましたら、以下のページよりお申し込みください。
(法人の方向けのサービスとなります)

※サービスサイト(SEO Japan)へと遷移します。