SEOエンジニア視点でどこからが重複コンテンツ?ペナルティー対象?リライトは?

公開日: : 最終更新日:2015/06/08 SEO, コンテンツ

重複コンテンツはSEOスパム?

重複コンテンツは絶対ダメ!
ただコピー&ペーストした記事が完全なアウトであることは皆さんご承知の通り。
では、

  • 言葉の定義を一文wikiから引用したら重複かな?
  • リライトをかけたからセーフ?
  • 文字数が少ないと重複コンテンツ判定を受けやすい?

これらは、どこで線を引くべきだろうか。
そんなことをこのポストでは見て行きたいと思います。

重複コンテンツと判定されるとどうなるの?

重複コンテンツとGoogleに判定された場合、インデックス削除の対象となります。
(ここでのインデックス削除とは、一度もインデックスされない場合を含みます。)
しかし削除対象になっても、削除されるとは限りません。
サイト全体がインデックス削除されるケースや、該当ページのみがインデックス削除されるケース、インデックスはされるがページ内文章で検索にはほぼ表示されない(一定程度順位が落ちている又は検索対象からもれている)、特段の変化はなく通常のページと同様の扱いを受けるケースと多様です。

削除される場合、されない場合の差は?

インデックス削除とは、すなわち検索結果からの追放です。
同じ重複コンテンツを掲載したサイトが複数あった場合でも、ペナルティーを受けるサイトと受けないサイトがあります。
つまり、Googleによる分別がなされます。そう、贔屓があります。

この分別は何を元に判断しているのでしょうか?
大きく分けて、次のポイントです。

公開日時

コンテンツをアップした日時です。厳密にはGoogleに該当記事を見つけてもらった日時です。
より古い記事(公開日が早い)ほど元のオリジナルコンテンツである可能性が高いと言えますし、多く転載された記事の魅力に早期に気付いた執筆者であるとも言えます。

ドメインの信頼性

Googleのアルゴリズムは転載者のドメインを見ています。
大手新聞社や教育機関、行政機関のドメインサイトが引用転載した多くの場合で、重複コンテンツとしてインデックス削除を受けていないのはこの為です。
一中小企業のサイトと匿名個人ブログでも信頼性に差はあると考えます。

重複割合

重複コンテンツが掲載されたページにおいて、重複原稿の占める割合です。
言葉の定義を一文引用した程度であれば、引用文章は全体の1割に満たない文章量となるでしょうし、ただのコピペ記事であったり雑なリライト記事であれば重複割合は5割を超える場合もあるでしょう。

引用や転載はどこまでがセーフ?

私の考えは、数行程度は引用であると考えています。

インターネット上では引用元ページへのリンクをはることで閲覧ユーザーは自由に転載元記事を読むことが可能となります。
ただし、リンク先ページが数千文字に及ぶコンテンツ量であれば、触れている部分のみを探しだす作業は大変です。
この場合、該当部分を引用しサイト内に示すことは閲覧者の利益になりますから許されるべき範囲と言えるでしょう。

では、数ページに及ぶ膨大なコンテンツを転載した場合、閲覧ユーザーは便利だと感じるでしょうか?
答えはそうとは言い切れません。
なぜなら、転載元の原稿量が増えることで閲覧中サイト著者の意見が確認しにくくなる弊害が発生します。
膨大なコンテンツを指し示す必要がある場合、引用ではなくリンクが有効であり、コンテンツを転載することは閲覧ユーザーの利益とならないと言えるでしょう。

つまり、引用文章が長くとも自身の意見文章部が非常に多量であれば重複ではないと考える意見もありますが、ユーザー視点で考えるとボリュームが全てではないことがわかるかと思います。
通常引用元が長い場合であれば、複数の章や段落に分けることが可能かと思います。
分けた段落毎に引用を行い、意見を記述することがユーザーの見やすいコンテンツ配置であり、望まれる引用法だと考えます。

またどこまでがセーフかを考える上での線引に引用元サイトの信頼性を重視する考え方があります。
これは、リンク先サイトが消滅し、指し示す情報が不明にならないようにとの考えがベースです。
実験結果などを引用する場合で、元となる論文掲載サイトが信頼出来ないというケースは稀だと思いますので、多くの場合で反論意見の掲示において考えられます。
この場合においても、重要度の高い一節を引用しボリュームのある全文はリンクとするか、著者が引用したい記事内意見をまとめたものを例示する等し代用する選択も有り得ます。

ですから、どこまでが重複コンテンツ判定を受けない安全なボリュームかで悩んだ際には、この考えをご参考になさってください。

リライト記事の未来

引用つまり元記事をそのままコピペすることは重複コンテンツ判定を受けやすいといった点、ご理解頂けたかと思います。
そこで多くのユーザーが取り入れている手法に原稿の『リライト』があります。

これは、元記事の主張や論点は変えず語句を並び替えたり、一人称や語調を変えて重複判定を免れようとするものです。
私の考える結論は、次回アップデートでリライト判定は厳しくなりコンテンツとして認められなくなるでしょう。
早ければ年内にもありそうな次期パンダアップデートですが、リライト記事サイトはかなり順位を落とすと予想しています。

  • 一人称を変える
  • 語調を変える
  • 形容詞や副詞を加える
  • 単語を置き換える

これらはリライトで取り入れられている手法の一部です。
これら手法を用いたリライト記事は、重複コンテンツと判定される日はすぐそこまで来ていると言えます。

今回はコンテンツに関するポストとなりました。
サイト価値を高めるコンテンツSEOの手法や実施時のポイントなども近く掲載できればと思っています。

あなたの周りにリライト記事を使っている方がいれば、この記事を伝えることで感謝されるかも!?

スポンサーリンク

関連記事

検索エンジンのユーザーシェアはどこが多い?

検索エンジンシェアをアンケートとって調べてみた

先日検索エンジンの利用調査アンケートを実施しました。 簡単に言えば「どこの検索エンジンを使

記事を読む

スマホ検索の順位変動はまだ?

モバイルフレンドリー要素が組み込まれる日時について

今日という日。4/21はGoogleが宣言したXデーです。(Xデーという言葉が合っているかは別と

記事を読む

サイトの表示速度を早くするには?

SEO効果あり!ページ表示速度の改善方法

サイトやブログの表示速度が遅い場合、大きなトラフィックの損失となっているかもしれません。

記事を読む

ヤフー虫眼鏡の仕組みは?

ヤフー検索の虫眼鏡はどんな仕組み?

新年明けましておめでとうございます。 今年も検索エンジンマーケティングに関するポストを様々

記事を読む

SSLメールフォームにすると順位は上がる?

SSL導入でSEO効果アップ?順位アップ!?

今回は、はじめにメールフォームや決済情報入力ページをSSL化するとSEO効果があるのかについ

記事を読む

ファイルの転送速度を上げるgzip圧縮

Page Speed Insightsの点数を上げる「圧縮を有効にする」の方法説明

昨年末に投稿したページ表示速度の改善方法【続編】内にて、gzip圧縮や画像の最適化について触れて

記事を読む

2016年最新SEOトレンドは、この4つをおさえるべし

2016年も始まって2週間。やっと今年1記事目の高橋です。 今年もよろしくお願いします。

記事を読む

URLの正規化って何?

URLの正規化はSEOの基本(wwwありなし・index.htmlありなしの統一)

今回のテーマは『URLの正規化』です。 運営開始から間もないサイトでも、運用歴の長いサイト

記事を読む

サイトの表示スピードを早くしたい!

サイトの表示スピードを上げるぞ!CSS・js圧縮、画像最適化でどの位早くなるかな?

ブラウザからサイトを閲覧する際には、CSS(カスケーディング・スタイル・シート)やjs(ジャバス

記事を読む

タイムスタンプのみ更新すれば、新鮮なサイトだと判定されるの?

SEO対策効果を高めるためにサテライトサイトのタイムスタンプを更新するべき?

今回のお話は『タイムスタンプ』です。 先日(といっても、1ヶ月近く経過してしまった)とあるアフ

記事を読む

スポンサーリンク
スポンサーリンク
2017年のSEOトレンド
2017年のSEOトレンド予測と重点対策ポイント

2017年に注力すべきSEO領域、新たにキャッチアップすべきSEO

SEOとキーワード数
SEOとキーワード数(メタタグ・タイトル・1ページ内)の正しい設計

この記事は、ご自身でサイト上位表示に取り組む方向けの内容です。

SEMって何?
SEMとは?SEOとの違い

ネット界隈はカタカナや3文字略称が頻繁に出てきます。 ここでは、

キーワードプランナーに仕様変更?
キーワードプランナーの不具合?稼働キャンペーンのないアカウントで検索数が正常に取得できない

今月の上旬に、キーワードプランナーに少し変更があったようです。

WordPressの一覧ページSEO
WordPressサイトの一覧ページ(アーカイブページ)のSEOについて(noindexの扱いなど)

今回はWordPressのお話です。 オウンドメディア、コンテン

→もっと見る

PAGE TOP ↑