「アフィリエイトを利用した記事があります」

重複コンテンツの調べ方は?ペナルティを防ぐための対処法!

重複コンテンツの調べ方は?ペナルティを防ぐための対処法! ブログ

重複コンテンツとは、自社サイトや他のサイトに既に存在する内容と非常に似ているコンテンツのことです。

別名「コピーコンテンツ」とも呼ばれます。

ユーザーが他のサイトで既に見た情報と同じ内容が含まれているコンテンツは、情報の重複となり、役立ちません。

ただし、ECサイトを運営する際に、カラーバリエーションごとに同じ内容のページが自動的に作成されたり、SEO対策のために似た検索キーワードをターゲットにした結果、似た内容のページができてしまうことがあります。

ここでは、重複コンテンツの基準やその調べ方、重複を避ける方法について解説します。

重複コンテンツの定義

スマホで読む電子書籍

Googleは重複コンテンツを次のように定義しています。

「同じドメイン内や複数のドメインにわたって存在する、他のコンテンツと完全に一致するか非常に似ているコンテンツのブロック」

引用元:Google検索セントラル、「重複コンテンツを避ける」

重複コンテンツがあると、ユーザーは同じ情報を繰り返し見ることになり不便です。

Googleは意図的な重複コンテンツに対して、インデックス登録やランキングで調整を行い、そのサイトのランキングを下げたり、インデックスから削除したりします。

自社サイト内の重複コンテンツが及ぼす影響

意図せず自社サイト内に重複コンテンツが存在する場合、以下のような影響があります。

コンテンツ評価の分散

1つ目は、コンテンツ評価の分散です。

Googleはサイト内の重複コンテンツを別々のコンテンツとして扱い、「どれがユーザーにとって最適か」を評価します。

外部サイトからのリンクも同様で、同じ内容のAコンテンツとBコンテンツにリンクが分散することがあります。

このように、評価が分散すると、どのコンテンツも十分に評価されず、検索結果に表示されないことがあります。

クローラビリティの悪化

2つ目は、クローラビリティの悪化です。

検索エンジンのクローラーはサイトを巡回し情報を収集しますが、重複コンテンツがあると同じ情報を繰り返し収集することになります。

クローラーには1サイトあたりのクロール上限(クロールバジェット)があり、重複コンテンツが多いとクロールバジェットを無駄に消費し、本来クロールされるべきページが見落とされてしまいます。

これにより、インデックス登録までの時間が長くなったり、検索順位が上がらなかったりすることがあります。

ペナルティのリスク

重複コンテンツがある場合、ペナルティを受けるリスクがあります。

意図せず内容が似通ってしまうことがありますが、上位表示している外部サイトを参考にする際に、無意識に同じ表現を使用してしまうこともあります。

意図的でなくとも、コピーコンテンツとみなされるとペナルティを受け、検索順位が下がり、インデックスから削除されることがあります。

重複コンテンツの判断基準

ABテストのイメージ

Googleが重複コンテンツと判断する基準は次の通りです。

自社サイト内の重複コンテンツ

  • wwwあり/なし、http/httpsの違いによるURL
  • パラメータやセッションIDを含む動的なURL
  • 様々なデバイスに対応するための別ページ
  • 商品のカラーやサイズごとに作成されたページ

これらの例は、301リダイレクトやcanonicalタグの設定がされていないと別々のコンテンツと認識されます。

外部サイトのコピーとみなされるコンテンツ

  • 引用元を明示せず、独自の情報を加えない転載
  • 語句を置き換えただけの軽微な修正転載
  • ユーザーにメリットがない他サイトの内容
  • 付加価値を提供しない他サイトの動画や画像の転載

SEO対策を進める中で、上位表示サイトの表現を参考にすることはありますが、無意識に同じ表現にならないよう注意が必要です。

重複コンテンツの回避策

コンテンツ作成後にコピー率をチェックし、一致率が高い場合は修正してから公開しましょう。

独自性のある内容を提供し、重複を避けることが重要です。

重複コンテンツのチェック方法

何かに気が付いた男性

重複コンテンツがSEOに与える影響と、その判断基準について解説しました。

ここからは、自社サイトにどの程度の重複コンテンツがあるかを確認する方法を紹介します。

Google Search Consoleで確認する

Google Search Consoleを使って、自社サイト内の重複コンテンツをチェックできます。

ログイン後、「セキュリティと手動による対策」メニューの「手動による対策」を選びます。

重複コンテンツがある場合は表示されるので、その内容を確認しましょう。

ペナルティの有無も確認できます。

手動ペナルティの対象となる重複コンテンツがなければ、「問題が検出されませんでした」と表示されます。

また、「インデックス作成」の「ページ」からも重複コンテンツを見つけることができます。

チェックツールを使う

新しいコンテンツを作成し、参考にした外部サイトとの重複を確認するには、以下のチェックツールが役立ちます。

sujiko.jp

Sujikoは、作成したコンテンツと参照したコンテンツの類似点を確認できる無料ツールです。

2つのURLを入力し、判定すると文章や構成の類似点を確認できます。

1日の使用回数は5回までです。

CopyContentDetector

CopyContentDetectorは、新しいコンテンツが他のサイトと重複していないかを確認できる無料ツールです。

コンテンツのテキストを貼り付け、「規約に同意してコピペチェックする」をクリックすると、重複している内容が表示されます。

私もライティングの仕事では、頻繁に使うツールです。

類義語への置き換えなどで対策しましょう。

重複コンテンツへの対策と回避方法

重複コンテンツが見つかった場合の対策方法と、今後の重複回避方法を解説します。

canonicalタグを使う

既に重複しているコンテンツがある場合は、canonicalタグを使用してURLの正規化を行います。

例えば、wwwの有無やhttp/https、ECサイトでの商品のバリエーションページはcanonicalタグで1つのURLに統一しましょう。

301リダイレクトを設定する

301リダイレクトを設定し、内容が薄く役立たないページを他のページに転送することで、重複コンテンツを回避できます。

robots.txtファイルを作成して301リダイレクトを設定し、関連するページに転送しましょう。

転送元と転送先の管理リストを作成し、どのページがどこに転送されているかを確認できるようにしておきましょう。

ページを削除する

重複するコンテンツの削除も一つの対策です。

情報が薄い場合やユーザーの検索意図に合わないページは削除を検討しましょう。

ただし、削除前に外部リンクや内部リンクがないか確認する必要があります。

リンクが貼られているページを削除するとSEO評価が下がるため、注意が必要です。

定型文の使用を避ける

定型文を避け、コンテンツごとに異なる表現を使いましょう。

自社サイト内の他ページで使った画像や文章を使い回すことは避け、各ページごとにユーザーの検索意図に合った情報を提供します。

キーワードとコンテンツのリスト化

対策キーワードとコンテンツをリスト化し、類似コンテンツの作成を避けましょう。

異なるキーワードでもユーザーの検索意図が似ている場合は、同一ページで複数のキーワードを対策するか、情報の粒度を変えて差別化します。

重複コンテンツはしっかりとチェックしよう! まとめ

重複コンテンツは、自社サイトや他サイトのコンテンツと内容が類似している場合に発生します。

URL表記の違いや内容の重複は、SEO評価の分散やクローラビリティの悪化を引き起こします。

canonicalタグや301リダイレクト、ページ削除などの対策を講じて、重複コンテンツを回避しましょう。

最後までお読みいただきありがとうございました!