前回の「Google Search Consoleで「SSL化のミス」を見つける方法」に引き続きGoogle Search Consoleをテーマにお話しします。
今回は「sitemap.xml」についてです。※参考:サイトマップ
「地味・・・」と思われがちですが、SEOにおいてsitemap.xmlは重要です。
なぜなら、サイト順位の下落やトラフィックの減少を引き起こす要因になるためです。
それにも関わらず、私が担当してきたサイトの約8割がsitemap.xmlのミスをそのままにしていました。
もしかすると、あなたが運営しているサイトも同じことが起きているかもしれませんので、ぜひこの記事を参考にしてみてください。
sitemap.xmlとは?
下記のようなURLの一覧で、Googleにページの存在を伝えることでクロールを助ける役割があります。
sitemap.xmlに記載すべきURL
sitemap.xmlには、「インデックスさせたいURL(正規URL)」を記載します。
サイトマップを使用する場合、サイトマップでは正規 URL のみを指定します。
そのため、逆に「インデックスさせたくないURL(非正規URL)」を記載すべきではありません。
例えば下記のようなURLです。
- noindexが入っているURL
- robots.txtでブロックしているURL
- 404エラーを返しているURL
- ソフト404エラーのURL
- リダイレクト元のURL
- canonical元のURL
これらを記載すると、SEOにおいて下記のような悪影響が出る可能性があります。
- 非正規URLが正規URLとして扱われてしまう
- インデックスすべきでないURLにクローラが多く回り、重要なURLへクローラが来ない、もしくはクロール頻度が落ちる
そのためsitemap.xmlを正しく記載することはSEOにおいて重要です。
では次に、sitemap.xmlのミスの見つけ方の手順を解説していきます。
sitemap.xmlのミスの見つけ方
手順①:「すべての送信済みページ」を選択
Google Search Consoleに表示されるURLがどのように検出されているのかというと、「sitemap.xmlで送信されたURL」と「Googleが独自に抽出したURL」の2つです。
デフォルトではすべてのデータ(すべての既知のページ)が表示されていますが、下記のように見たいURLだけを選択して見ることができます。
今回は「sitemap.xml」のミスを見つけることが目的なので、「すべての送信済みページ」を選択してください。
手順②:「カバレッジ > エラー」の確認
カバレッジのエラーを選択して、「詳細」に出ている内容を確認してください。
エラーの詳細ごとに対処方法を説明していきます。
送信された URL に noindex タグが追加されています
先述しました通り、noindexが入っているページはsitemap.xmlに記載すべきではありません。
「今後もnoindexを入れるべきURL」でしたらsitemap.xmlから削除して下さい。
「noindexを入れるべきではないURL」でしたら、noindexを外しましょう。
修正が終わりましたら「修正を検証」を選択し、Googleが認識するのを待ちます。
これ以降の項目も、修正後は「修正を検証」を行ってください。
送信された URL が robots.txt によってブロックされました
robots.txtでブロックすべきURLかどうか確認してください。
「ブロックすべきURL」ならsitemap.xmlから削除、「ブロックすべきでないURL」でしたら、robots.txtのブロックを解除してください。
●参考:「robots.txt によりブロックされましたが、インデックスに登録しました」とSearch Consoleに表示された時の対処方法
送信された URL が見つかりませんでした(404)
「削除されたURL」である場合はsitemap.xmlから削除してください。
「URLの記載ミス」の場合は、正しいURLに修正しましょう。
送信された URL はソフト 404 エラーのようです
ページが存在しない場合、本来であればステータスコード404(未検出)を返す必要があります。
しかし存在しないにも関わらずステータスコード200(正常)を返してしまうケースがあり、これを「ソフト404」といいます。
ステータスコード200が返されると、GoogleはそのURLにページが存在するものと判断し、インデックスしてしまうケースがあります。
そのためステータスコードを「200」から「404」に変更し、sitemap.xmlから削除して下さい。
●参考:「送信された URL はソフト 404 エラーのようです」とSearch Consoleに表示されたときの対処方法
手順③:「カバレッジ > 除外」の確認
カバレッジの「除外」を選択して、「詳細」に出ている内容を確認してください。
ちなみに除外とは「エラー以外のなんらかの理由でインデックスに登録できない」ことを表しています。
いくつか項目がありますが、今回は「重複しています。送信された URL が正規 URL として選択されていません」に注目してください。
重複しています。送信された URL が正規 URL として選択されていません
このメッセージが表示されるときは、sitemap.xmlの中に下記の2つが記載されている可能性が高いです。
- リダイレクト元のURL
- canonical元のURL
実際にページを開いてみて、「リダイレクトされていないか?」「canonicalが入っていないか?」を確認してみてください。
確認の際に役に立つツール
リダイレクトを確認する際には、Chromeの拡張機能の「Redirect Path」がおすすめです。
下記のようにビジュアル的にリダイレクトの過程が見れるので、私はよく使用しています。
●参考:Redirect Path – Chrome ウェブストア
またcanonicalのチェックでしたら、Chromeの拡張機能の「SEOTagViewer」がおすすめです。
下記のように開いているページの右下に、canonicalで指定しているURLが表示されます。
●参考:SEOTagViewer – Chrome ウェブストア
sitemap.xmlの必要性
「sitemap.xmlが必要なサイト」は下記のものだとGoogleはいっています。
- サイトのサイズが非常に大きい
- サイトにどこからもリンクされていない、または適切にリンクされていないコンテンツ ページのアーカイブが大量にある
- サイトが新しく、外部からのリンクが少ない
- サイトに動画や画像などのリッチメディア コンテンツが多数含まれている、またはサイトが Google ニュースに表示されている
逆に「sitemap.xmlが必要ではないサイト」は下記のとおりです。
- サイトのサイズが「小さい」
- シンプルなサイト ホスティング サービスを利用している
- サイトはサイト内で完全にリンクされている
- メディア ファイル (動画、画像)またはニュースページが多くない
そのためsitemap.xmlを正しい形に維持し続けることが困難で、「sitemap.xmlが必要でないサイト」にあなたのサイトが当てはまるのであれば、sitemap.xmlを削除することも一つの選択肢です。
「sitemap.xmlを削除したら、SEOに悪影響を及ぼすのではないか?」という心配をされるお客様もいらっしゃいますが、実際に削除して順位が下がったり、トラフィックが下がったりしたケースは1件もありませんでした。
Googleのクロール技術は、昔とは比較にならないくらい高度なものになっているため、安心して削除して下さい。
サイトの各ページが適切にリンクされていれば、Google は通常、サイトのほとんどのページを検出できます
まとめ
sitemap.xmlはSEOにおいて重要である一方で、正しい形に維持し続ける必要があります。
あなたのサイトが「sitemap.xmlが必要なサイト」であれば、今回ご紹介した方法で定期的にメンテナンスを続けてください。
逆に「sitemap.xmlが必要でないサイト」であれば、削除することを検討してみてください。
アイオイクスではSEOを軸としたWebコンサルティングサービスを提供しています。
いわゆるSEOの型に沿った施策ではなく、お客様の事業やWebサイトの構成を踏まえた最適な施策のご提案を重要視しています。SEOにお困りの際はぜひご相談ください。
→SEOコンサルティング サービスページ
アイオイクスでは一緒に働く仲間を募集しています
アイオイクスのWebコンサルティング事業部では、「一緒に挑戦し、成功の物語を共有する」という理想像を掲げ、本質的な取り組みを推進しています。私たちと汎用性の高いスキルを突き詰め、自由に仕事をしていきませんか。
メールマガジンの登録はこちら
SEOに関連する記事の更新やセミナー情報をお届けします。