「クロール済み – インデックス未登録」とSearchConsoleで表示されたときの対処方法

こんにちは、Webコンサルタントの谷藤(@go_tanifuji)です。

今回はSearch Consoleシリーズで、「クロール済み – インデックス未登録」について説明します。

クロール済み - インデックス未登録

「これだけ見ても、何をどうしたらいいかわからない」とお客様からお問い合わせをいただくことも多いので、参考にしていただければ幸いです。

目次

「クロール済み – インデックス未登録」は低品質コンテンツの可能性がある

Search Consoleのヘルプページには下記のように書かれています。

クロール済み – インデックス未登録: ページは Google によりクロールされましたが、インデックスには登録されていません。今後、インデックスに登録される可能性がありますが、登録されない可能性もあります。この URL のクロールのリクエストを再送信する必要はありません。

●引用元:インデックス カバレッジ レポート – Search Console ヘルプ

結局どうしたらいいか分かりませんよね。

しかし、Googleの金谷さんは「ウェブマスター オフィスアワー(2018 年 12 月 17 日)」で「クロール済み – インデックス未登録」は「低品質コンテンツ」の可能性があると述べています。

ただ、あくまで「可能性」なので、一律に低品質コンテンツと見なさないようにして下さい。

私の経験上、下記の3つが「クロール済み – インデックス未登録」に表示されている場合、低品質コンテンツと見なされています。

  1. 記事コンテンツ
  2. タグページやカテゴリーページ
  3. 自動生成されたコンテンツ

1.記事コンテンツ

内容が薄いコンテンツのため、低品質と見なされているケースが多いです。

改善策は下記の3つです。

  1. 高品質に改善
  2. 削除
  3. noindexを設定

1.高品質に改善

ユーザーに有益な情報を与えるコンテンツを追加することにより、コンテンツを高品質にするという対応です。

例えば、「そのテーマの専門家の意見を追加する」「わかりやすい図解を差し込む」といった対応は、コンテンツを高品質にすることに繋がるでしょう。

2.削除


コンテンツを高品質化できない場合は、削除することを推奨します。

3.noindexを設定

高品質化も削除もできない場合は、noindexを設定します。

2.タグページやカテゴリーページ

例えば下記のようにタグページを作ったものの、1記事しかないものなどです。

1記事だけのタグページ

実際このタグページは「クロール済み – インデックス未登録」に表示されています。

「クロール済み - インデックス未登録」

この場合の改善策としては、タグページの記事数を増やすことです。もし増やせる記事がなく、今後も増えそうにないものに関しては削除することを推奨します。

(「SEO Japanができてないじゃないか!」と突っ込まれそうですが、この記事を書くために残しているということにさせて下さい(^^;)

3.自動生成されたコンテンツ

機械的に作られたコンテンツのことで、低品質コンテンツであり、Googleの品質ガイドライン違反でもあります。

自動的に生成されたコンテンツ(「自動生成コンテンツ」)とは、プログラムによって生成されたコンテンツのことです。 Google では、検索ランキングを操作することを目的としている、ユーザーの役に立たないコンテンツに対し、措置を取ることがあります。

コンテンツの自動生成 | Google 検索セントラル

昔のGoogleはページ数が多いサイトを評価していたため、記事を量産するための自動生成ツールが流行りました。

その記事にはキーワードは入っていますが、文章としてなりたっておらず、通称「ワードサラダ」といわれていました。

改善策としての選択肢は1つで、コンテンツを自動生成せずに人が書くことです。

ユーザーに付加価値を与えるコンテンツ制作に路線に切り替えていきましょう。

●関連記事:Google Search Consoleで「低品質コンテンツ」を見つける方法と対処方法

低品質とは限らないコンテンツ

下記の2つは低品質コンテンツと見なされないので対策は不要です。

  1. フィードページ
  2. 分割されたページ

フィードページ

フィードはいわゆるRSSフィードのことで、RSSリーダーに登録するときに使われる仕組みです。

Googleは下記のようにフィードを推奨しています。

最適なクロールのために、XMLサイトマップとRSS/Atomフィードの両方を使用することをお勧めします。

Official Google Webmaster Central Blog: Best practices for XML sitemaps & RSS/Atom feeds

また、世界中で使用されているWordPressにデフォルトで設定されているので、仮にフィードを低品質コンテンツとGoogleが見なした場合、WordPressで作成されているサイトは軒並み順位を下げるはずです。

そのような現象は起きていないことから、Googleはフィードを低品質コンテンツと見なしていないといえます。

しかし、下記のようにGoogle Search Consoleの「クロール済み – インデックス未登録」にフィードが大量に出ていると心配されるお客様もいらっしゃいます。

フィードページ

また表示できるURLが1,000件までのため、フィードが邪魔して他のURLが見れないという場合もあります。

そういう時は、HTTPヘッダーに 「X-Robots-Tag: noindex」を追加すればフィードにnoindexが設定されるため、「クロール済み – インデックス未登録」に表示されなくなります。

noindex

●参考:robots メタタグ、data-nosnippet、X-Robots-Tag の仕様  |  Google 検索デベロッパー ガイド  

WordPressを利用されているのであれば、プラグインの「All in One SEO Pack」を入れるとデフォルトでフィードにnoindexが入るようになっていますので試してみてください。

分割されたページ

ページネーション

長い記事が分割されたページや、カテゴリーページのような記事一覧ページの場合、Googleは1ページ目に評価を集中させて、1ページ目のみインデックスさせる傾向にあります。

そのため2ページ目以降はインデックスさせていないだけで、低品質と判断されているわけではなりません。

よく2ページ目以降を1ページ目へcanonicalを向けているケースを見かけますが、これは誤りです。

2 ページ目(またはそれ以降のページ)に 1 ページ目への rel=canonical リンクを指定するのは rel=canonical の正しい使用法ではありません。

Google ウェブマスター向け公式ブログ [JA] : rel=canonical 属性に関する 5 つのよくある間違い

自ページにcanonicalを向けるのが正しい方法です。

自己参照canonical

まとめ

「クロール済み – インデックス未登録」は、そのページのタイプ(記事ページ、タグなどのアーカイブページ、自動生成系など)によって対処方法が異なります。

この記事を参考に改善していただければ幸いです。

もし、もっとSearch Consoleを使いこなしたい場合は下記のホワイトペーパーがお勧めです。

SEOでお困りのことがありましたら、下記から問い合わせください。

お問い合わせフォーム

サービス資料のダウンロードは下記からできます。

サービス資料ダウンロード

では、また次の記事でお会いしましょう!

この記事を書いた人

システムエンジニアと事業経営を経てアイオイクス株式会社に入社。

インハウスとアフィリエイトでWebマーケティングを学び、現在はWebコンサルタントとして従事しています。

SEO歴:11年

【保有資格】
「中小企業診断士」

【認定試験】
米国semrush社 テクニカルSEO試験合格
米国CXL社 テクニカルSEO試験合格
米国CXL社認定Optimizer

Twitter:@go_tanifuji

目次
閉じる