Google Search Consoleで「低品質コンテンツ」を見つける方法と対処方法

こんにちは、Webコンサルタントの谷藤(@go_tanifuji)です。

今回はGoogle Search Consoleシリーズで、テーマは「低品質コンテンツ」です。

低品質コンテンツに対してとても神経質になられているお客様が多く、「このコンテンツは低品質かもしれないので、ペナルティを受ける可能性がありますか?」という質問をよく受けます。

その際に回答する内容をまとめましたので、ぜひ参考としてみてください。

低品質コンテンツとは(定義)

SEOにおける低品質コンテンツとは、「ユーザーが求めている情報が掲載されておらず、低品質とみなされているコンテンツ」のことを指します。

とあるページが低品質とみなされた場合、Googleはそのページをインデックスせず、結果として検索結果に表示されないことになります。

また、低品質コンテンツがサイト内に存在していると、サイトの評価が下がる原因となってしまうため、SEOに影響があるのであれば、対応をしなければなりません。

低品質コンテンツの対応が必要なサイト

低品質コンテンツがあるからといって、すべてのサイトが対応しなければいけないかというとそうではありません。

対応が必要な場合は下記の2つです。

  1. サイトの大部分が低品質コンテンツの場合
  2. ガイドライン違反をしているコンテンツの場合

そのため低品質コンテンツが数ページしかなく、ガイドライン違反をしていないサイトに関しては対応の必要がありません。

低品質コンテンツが与えるSEOの悪影響

下記の2つのリスクがあります。

  1. パンダアップデートを受けるリスク
  2. Googleから手動対策(ペナルティ)を受けるリスク

パンダアップデートの影響を受けるリスク

パンダアップデートとは2011年に導入された低品質なサイトの順位を下げるアルゴリズムのことです。

このアルゴリズムの変更では、低品質なサイトの掲載順位を下げ、同時に、良質なサイトの掲載順位をより適切に評価します。

●引用元:Google ウェブマスター向け公式ブログ [JA] : Google 検索が、高品質なサイトをよりよく評価するようになりました

Googleから手動対策(ペナルティ)を受けるリスク

手動対策(ペナルティ)とは、Googleが目視でガイドライン違反をしていないかチェックをし、違反している場合は手動で対策を施すものです。

その際に下記のようなメッセージが送られてきます。手動ペナルティなお、手動対策は通称ペナルティと呼ばれていますが、Google自身はペナルティという言葉を使用していません。

低品質コンテンツをなくすことによるSEOの好影響

下記の2つが期待できます。

  1. クロール効率の改善
  2. サイト全体の品質の改善

クロール効率の改善

低品質コンテンツがサイトの多くを占めている場合、無駄なクロールが発生しています。

そのため低品質コンテンツを削除することで、重要なページへクロールされやすくなり、クロールの効率が改善されます。

サイト全体の品質の改善

低品質コンテンツがサイトの多くを占めている場合、サイト自体が低品質だと判断されてしまいます。

そのため低品質コンテンツを削除し、高品質なコンテンツの割合を増やすことで、サイト全体の品質を改善することができます。

低品質とみなされているコンテンツを見つけるには、Google Search Consoleを活用します。

クロール済み-インデックス未登録

低品質コンテンツの可能性があるページは「カバレッジ > 除外 > クロール済み-インデックス未登録」に表示されます。

クロール済み - インデックス未登録

●参考:ウェブマスター オフィスアワー 2018 年 12 月 17 日

低品質コンテンツには大きく分けて4種類がある

ではどういったページが低品質コンテンツで、それに対してどのような対応が必要かをそれぞれ解説していきます。

何をもって低品質コンテンツかというのは人によって意見が分かれますが、Googleが公式に明言しているのは下記の4つです。

  1. 内容の薄いコンテンツ
  2. 無断複製されたコンテンツ
  3. 自動生成されたコンテンツ
  4. コメントスパムがあるコンテンツ

①内容の薄いコンテンツ

ありきたりの内容で、ユーザーに有益な情報を与えていないコンテンツを指します。

私が担当したサイトの例ですと、社員が持ち回りで「今日の一言」と題して「石の上にも三年!」というように一言書くという企画がありました。

これらのページはことごとく「クロール済み-インデックス未登録」に表示され続けており、明らかに低品質コンテンツとしてGoogleに扱われていました。

対処法は以下の3つです。

  1. 高品質に改善
  2. 削除
  3. noindexを設定

高品質に改善

ユーザーに有益な情報を与えるコンテンツを追加することにより、高品質化させるという対応です。

例えばそのテーマの専門家の意見を追加することで、高品質化することができます。

削除

高品質化できない場合は、削除することを推奨します。

noindexを設定

高品質化も削除もできない場合は、noindexを設定します。

どのような場合に行うかというと、サイトのテーマとはまったく関係のない「社長ブログ」がよくある事例です。

社長ブログ

サイトのテーマに関係がないので高品質化が難しく、「社長のブログなので削除はちょっと・・・」ということで削除もできないというケースがよくあります。

そういうケースでは、そっとnoindexを設定することを推奨しています。

②無断複製されたコンテンツ

無断で転載している場合はGoogleの品質ガイドライン違反にあたります。

無断複製されたコンテンツの例としては、次のようなものが挙げられます。

  • 他のサイトのコンテンツをコピーし、独自のコンテンツや付加価値を加えることなく転載しているサイト
  • 他のサイトのコンテンツをコピーし、(語句を類義語に置き換えたり自動化された手法を使用したりして)若干の修正を加えた上で転載しているサイト
  • 何らかの独自の体系付けやユーザーへの利便性を提供することなく他のサイトからのコンテンツ フィードをそのまま掲載しているサイト
  • ユーザーに実質的な付加価値を提供することなく、他のサイトの動画、画像、その他のメディアなどのコンテンツを埋め込んだだけのサイト

●引用元:無断複製されたコンテンツ – Search Console ヘルプ

以前流行っていたキュレーションサイトもこれにあたります。

しかし、当時キュレーションサイトは検索意図の網羅性が評価されてしまい、上位表示されて問題になっていました。

それに対し2017年2月にGoogleはアルゴリズムの変更を行い、キュレーションサイトの評価を下げました。

ウェブサイトの品質の評価方法に改善を加えました。

今回のアップデートにより、ユーザーに有用で信頼できる情報を提供することよりも、検索結果のより上位に自ページを表示させることに主眼を置く、品質の低いサイトの順位が下がります。

その結果、オリジナルで有用なコンテンツを持つ高品質なサイトが、より上位に表示されるようになります。

●引用元:Google ウェブマスター向け公式ブログ [JA] : 日本語検索の品質向上にむけて

他のサイトからの転載を行うのであれば、転載の許可をもらったうえで、下記の2つの対処方法を検討しましょう。

  1. 高品質に改善
  2. canonicalの設定

高品質に改善

転載するだけでなく、独自の見解を加えることで付加価値を与えて高品質化させます。

canonicalの設定

高品質化が難しい時はcanonicalの設定を行います。

転載元のページに向けてcanonicalを設定し、自社ページが非正規ページであることをGoogleに伝えます。

「ドメインをまたいでcanonicalを設定できるんですか?」と質問を受けることがありますが、Googleはサポートしています。

we’re announcing our support of the cross-domain rel=”canonical” link element.

クロスドメインのcanonical設定をサポートすることを発表します。

●引用元:Official Google Webmaster Central Blog: Handling legitimate cross-domain content duplication

ただ、canonicalは「命令」ではなく「ヒント」として扱われるので、可能であれば高品質化を推奨します。

③自動生成されたコンテンツ

機械的に作られたコンテンツのことで、これもGoogleの品質ガイドライン違反にあたります。

自動的に生成されたコンテンツ(「自動生成コンテンツ」)とは、プログラムによって生成されたコンテンツのことです。

Google では、検索ランキングを操作することを目的としている、ユーザーの役に立たないコンテンツに対し、措置を取ることがあります。

●引用元:コンテンツの自動生成 – Search Console ヘルプ

昔のGoogleはページ数が多いサイトを評価していたため、記事を量産するための自動生成ツールが流行りました。

その記事にはキーワードは入っていますが、文章としてなりたっておらず、通称「ワードサラダ」といわれていました。

対処法としての選択肢は1つで、コンテンツを自動生成せずに人が書くことです。

ユーザーに付加価値を与えるコンテンツ制作に路線に切り替えていきましょう。

④コメントスパムがあるコンテンツ

ブログなどにあるコメント機能に、広告のようなコメントや関係のないサイトへ誘導するリンクがあるものはスパム行為と判断されます。

そしてそのページが低品質コンテンツとGoogleに認識されるとランキングに悪影響を及ぼすことがあります。

コメントを活用すれば、コミュニティを形成し、読者を獲得することができます。

しかし残念なことに、スパマーなどに悪用されることも頻繁にあります。

スパマーは多くの場合、スクリプトやその他のソフトウェアを使用してスパムを生成し投稿します。

広告のようなコメントや関係のないサイトへのランダムリンクはコメントスパムです。

この種類のスパムは次のような悪影響をサイトに及ぼす可能性があります。

  • ウェブサイトの一部に低品質なコンテンツがあると、サイト全体のランキングに影響を与えることがあります。

●引用元:コメントスパムを防止する方法 – Search Console ヘルプ

そのため下記のようなコメントスパム対策を行う必要があります。

  1. コメントを承認制にする
  2. スパム対策ツールを導入する
  3. リンクにnofollow属性を設定する

コメントを承認制にする

コメントを即時に公開するのではなく、管理者がスパムコメントではないことを確認してから承認する方法です。

Word Pressなど多くのCMSにデフォルトである機能です。

ただ、コメントが多い場合は管理者の負担が増えてしまうのがデメリットです。

スパム対策ツールを導入する

ユーザーに対し、悪意のあるスパムスクリプトではない本物の人間であることを証明するよう求めるツールです。

下記はGoogleが無料で提供する「reCAPTCHA」簡単にサイトに実装できます。

 reCAPTCHA

●参考:reCAPTCHA

リンクにnofollow属性を設定する

下記のようにリンクにnofollow属性を設定すると、リンク先を評価しないことをGoogleに伝えることができます。

<a href=”http://www.example.com/” rel=”nofollow“>

またugc属性でも代替可能です。

<a href=”http://www.example.com/” rel=”ugc“>

これによりユーザーが作成したリンクであることをGoogleに伝えることができます。

低品質とは限らないコンテンツ

下記の3つは一概に低品質コンテンツといえません。

  1. 文字数の少ないページ
  2. トラフィックが少ないページ
  3. フィード

①文字数の少ないページ

例えば「多幸とは」と検索すると1位にランキングしているのはgoo国語辞書で、メインコンテンツは「非常にしあわせなこと。また、そのさま。」の1行です。

「多幸とは」と検索する人の検索意図は、言葉の意味を知りたいだけですので、1行だけでも十分なのです。

そのため文字数が少なくても、「クロール済み – インデックス未登録」に表示されておらず、ユーザーの検索意図に応えているのであれば低品質コンテンツではありません。

②トラフィックが少ないページ

お客様からよく「トラフィックが少ないコンテンツは、低品質だから削除した方がいいですよね?」という質問を受けます。

これは誤りで、Googleのジョン・ミューラー氏は「トラフィックが少ないからという理由だけで低品質コンテンツと判断しない方がいい」と述べています。

気を付けることがひとつあるとしたら、検索トラフィックが少ないという理由からそのコンテンツが悪いからに違いないと考え、削除しようとすることだ。

たいした検索トラフィックがなかったとしてもまったく問題ないときもある。検索するユーザーが単に少ないだけかもしれない。

(中略)

昔の天気予報のコンテンツを残しておいたとして、10年後にだれかが調査目的で見つけて役に立ててもらえるかもしれない。

10年前の天気予報というのは、もはや内容の薄いコンテンツとも言えそうだが、固有の情報を持っているし、もし存在しなければ検索で発見してもらえなかっただろう。

●引用元:低品質コンテンツがわずかに存在していても検索では問題にならない。検索トラフィックがないことは価値がないことを意味しない | 海外SEO情報ブログ

そのため「クロール済み – インデックス未登録」に表示されておらず、誰かの役に立つコンテンツであれば低品質ではないのです。

③フィード

フィードはいわゆるRSSフィードのことで、RSSリーダーに登録するときに使われる仕組みです。

Googleは下記のようにフィードを推奨しています。

For optimal crawling, we recommend using both XML sitemaps and RSS/Atom feeds.

最適なクロールのために、XMLサイトマップとRSS/Atomフィードの両方を使用することをお勧めします。

●引用元:Official Google Webmaster Central Blog: Best practices for XML sitemaps & RSS/Atom feeds

また、世界中で使用されているWordPressにデフォルトで設定されているので、仮にフィードを低品質コンテンツとGoogleが見なした場合、WordPressで作成されているサイトは軒並み順位を下げるはずです。

そのような現象は起きていないことから、Googleはフィードを低品質コンテンツと見なしていないといえます。

しかし、下記のようにGoogle Search Consoleの「クロール済み – インデックス未登録」にフィードが大量に出ていると心配されるお客様もいらっしゃいます。

feed

また表示できるURLが1,000件までのため、フィードが邪魔して他のURLが見れないという場合もあります。

そういう時は「HTTPヘッダーに X-Robots-Tag: noindex, follow」を追加すればフィードにnoindexが設定され、「クロール済み – インデックス未登録」から「noindex タグによって除外されました」に移動します。

 X-Robots-Tag

●参考:robots メタタグ、data-nosnippet、X-Robots-Tag の仕様  |  Google 検索デベロッパー ガイド  

WordPressを利用されているのであれば、プラグインの「All in One SEO Pack」を入れるとデフォルトでフィードにnoindexが入るようになっていますので試してみてください。

まとめ

低品質コンテンツの特定方法と、その対処法について解説してきました。

低品質コンテンツに関しては様々な噂があり、判断に迷う方も多いと思います。

この記事を参考に正しい対応をしていただければ幸いです。

もしSEOでお困りのことがありましたら、アイオイクスまでお問い合わせください。

それでは、また次の記事でお会いしましょう!


無料サイト診断サービスを行っています

アイオイクス株式会社では、Webサイトの無料診断を行っております。

弊社のコンサルタントがSEO・CRO(コンバージョン改善)の観点から御社のWebサイトを分析し、改善案を提案させていただきます。

もし興味がございましたら、以下のページよりお申し込みください。
(法人の方向けのサービスとなります)

※サービスサイト(SEO Japan)へと遷移します。