今回はSearch Consoleシリーズで、「クロール済み – インデックス未登録」について説明します。
「これだけ見ても、何をどうしたらいいかわからない」とお客様からお問い合わせをいただくことも多いので、参考にしていただければ幸いです。
「クロール済み – インデックス未登録」は低品質コンテンツの可能性がある
Search Consoleのヘルプページには下記のように書かれています。
クロール済み – インデックス未登録: ページは Google によりクロールされましたが、インデックスには登録されていません。今後、インデックスに登録される可能性がありますが、登録されない可能性もあります。この URL のクロールのリクエストを再送信する必要はありません。
●引用元:インデックス カバレッジ レポート – Search Console ヘルプ
結局どうしたらいいか分かりませんよね。
しかし、Googleの金谷さんは「ウェブマスター オフィスアワー(2018 年 12 月 17 日)」で「クロール済み – インデックス未登録」は「低品質コンテンツ」の可能性があると述べています。
ただ、あくまで「可能性」なので、一律に低品質コンテンツと見なさないようにして下さい。
私の経験上、下記の3つが「クロール済み – インデックス未登録」に表示されている場合、低品質コンテンツと見なされています。
- 記事コンテンツ
- タグページやカテゴリーページ
- 自動生成されたコンテンツ
1.記事コンテンツ
内容が薄いコンテンツのため、低品質と見なされているケースが多いです。
改善策は下記の3つです。
- 高品質に改善
- 削除
- noindexを設定
1.高品質に改善
ユーザーに有益な情報を与えるコンテンツを追加することにより、コンテンツを高品質にするという対応です。
例えば、「そのテーマの専門家の意見を追加する」「わかりやすい図解を差し込む」といった対応は、コンテンツを高品質にすることに繋がるでしょう。
2.削除
コンテンツを高品質化できない場合は、削除することを推奨します。
3.noindexを設定
高品質化も削除もできない場合は、noindexを設定します。
2.タグページやカテゴリーページ
例えば下記のようにタグページを作ったものの、1記事しかないものなどです。
実際このタグページは「クロール済み – インデックス未登録」に表示されています。
この場合の改善策としては、タグページの記事数を増やすことです。もし増やせる記事がなく、今後も増えそうにないものに関しては削除することを推奨します。
(「SEO Japanができてないじゃないか!」と突っ込まれそうですが、この記事を書くために残しているということにさせて下さい(^^;)
3.自動生成されたコンテンツ
機械的に作られたコンテンツのことで、低品質コンテンツであり、Googleの品質ガイドライン違反でもあります。
自動的に生成されたコンテンツ(「自動生成コンテンツ」)とは、プログラムによって生成されたコンテンツのことです。 Google では、検索ランキングを操作することを目的としている、ユーザーの役に立たないコンテンツに対し、措置を取ることがあります。
コンテンツの自動生成 | Google 検索セントラル
昔のGoogleはページ数が多いサイトを評価していたため、記事を量産するための自動生成ツールが流行りました。
その記事にはキーワードは入っていますが、文章としてなりたっておらず、通称「ワードサラダ」といわれていました。
改善策としての選択肢は1つで、コンテンツを自動生成せずに人が書くことです。
ユーザーに付加価値を与えるコンテンツ制作に路線に切り替えていきましょう。
●関連記事:Google Search Consoleで「低品質コンテンツ」を見つける方法と対処方法
低品質とは限らないコンテンツ
下記の2つは低品質コンテンツと見なされないので対策は不要です。
- フィードページ
- 分割されたページ
フィードページ
フィードはいわゆるRSSフィードのことで、RSSリーダーに登録するときに使われる仕組みです。
Googleは下記のようにフィードを推奨しています。
最適なクロールのために、XMLサイトマップとRSS/Atomフィードの両方を使用することをお勧めします。
Official Google Webmaster Central Blog: Best practices for XML sitemaps & RSS/Atom feeds
また、世界中で使用されているWordPressにデフォルトで設定されているので、仮にフィードを低品質コンテンツとGoogleが見なした場合、WordPressで作成されているサイトは軒並み順位を下げるはずです。
そのような現象は起きていないことから、Googleはフィードを低品質コンテンツと見なしていないといえます。
しかし、下記のようにGoogle Search Consoleの「クロール済み – インデックス未登録」にフィードが大量に出ていると心配されるお客様もいらっしゃいます。
また表示できるURLが1,000件までのため、フィードが邪魔して他のURLが見れないという場合もあります。
そういう時は、HTTPヘッダーに 「X-Robots-Tag: noindex」を追加すればフィードにnoindexが設定されるため、「クロール済み – インデックス未登録」に表示されなくなります。
●参考:robots メタタグ、data-nosnippet、X-Robots-Tag の仕様 | Google 検索デベロッパー ガイド
WordPressを利用されているのであれば、プラグインの「All in One SEO Pack」を入れるとデフォルトでフィードにnoindexが入るようになっていますので試してみてください。
分割されたページ
長い記事が分割されたページや、カテゴリーページのような記事一覧ページの場合、Googleは1ページ目に評価を集中させて、1ページ目のみインデックスさせる傾向にあります。
そのため2ページ目以降はインデックスさせていないだけで、低品質と判断されているわけではなりません。
よく2ページ目以降を1ページ目へcanonicalを向けているケースを見かけますが、これは誤りです。
2 ページ目(またはそれ以降のページ)に 1 ページ目への rel=canonical リンクを指定するのは rel=canonical の正しい使用法ではありません。
Google ウェブマスター向け公式ブログ [JA] : rel=canonical 属性に関する 5 つのよくある間違い
自ページにcanonicalを向けるのが正しい方法です。
まとめ
「クロール済み – インデックス未登録」は、そのページのタイプ(記事ページ、タグなどのアーカイブページ、自動生成系など)によって対処方法が異なります。
この記事を参考に改善していただければ幸いです。
アイオイクスではSEOを軸としたWebコンサルティングサービスを提供しています。
いわゆるSEOの型に沿った施策ではなく、お客様の事業やWebサイトの構成を踏まえた最適な施策のご提案を重要視しています。SEOにお困りの際はぜひご相談ください。
→SEOコンサルティング サービスページ
アイオイクスでは一緒に働く仲間を募集しています
アイオイクスのWebコンサルティング事業部では、「一緒に挑戦し、成功の物語を共有する」という理想像を掲げ、本質的な取り組みを推進しています。私たちと汎用性の高いスキルを突き詰め、自由に仕事をしていきませんか。
メールマガジンの登録はこちら
SEOに関連する記事の更新やセミナー情報をお届けします。