SEOエンジニア視点でどこからが重複コンテンツ?ペナルティー対象?リライトは?

公開日: : 最終更新日:2015/06/08 SEO, コンテンツ

   
 
   

重複コンテンツはSEOスパム?

重複コンテンツは絶対ダメ!
ただコピー&ペーストした記事が完全なアウトであることは皆さんご承知の通り。
では、

  • 言葉の定義を一文wikiから引用したら重複かな?
  • リライトをかけたからセーフ?
  • 文字数が少ないと重複コンテンツ判定を受けやすい?

これらは、どこで線を引くべきだろうか。
そんなことをこのポストでは見て行きたいと思います。

重複コンテンツと判定されるとどうなるの?

重複コンテンツとGoogleに判定された場合、インデックス削除の対象となります。
(ここでのインデックス削除とは、一度もインデックスされない場合を含みます。)
しかし削除対象になっても、削除されるとは限りません。
サイト全体がインデックス削除されるケースや、該当ページのみがインデックス削除されるケース、インデックスはされるがページ内文章で検索にはほぼ表示されない(一定程度順位が落ちている又は検索対象からもれている)、特段の変化はなく通常のページと同様の扱いを受けるケースと多様です。

削除される場合、されない場合の差は?

インデックス削除とは、すなわち検索結果からの追放です。
同じ重複コンテンツを掲載したサイトが複数あった場合でも、ペナルティーを受けるサイトと受けないサイトがあります。
つまり、Googleによる分別がなされます。そう、贔屓があります。

この分別は何を元に判断しているのでしょうか?
大きく分けて、次のポイントです。

公開日時

コンテンツをアップした日時です。厳密にはGoogleに該当記事を見つけてもらった日時です。
より古い記事(公開日が早い)ほど元のオリジナルコンテンツである可能性が高いと言えますし、多く転載された記事の魅力に早期に気付いた執筆者であるとも言えます。

ドメインの信頼性

Googleのアルゴリズムは転載者のドメインを見ています。
大手新聞社や教育機関、行政機関のドメインサイトが引用転載した多くの場合で、重複コンテンツとしてインデックス削除を受けていないのはこの為です。
一中小企業のサイトと匿名個人ブログでも信頼性に差はあると考えます。

重複割合

重複コンテンツが掲載されたページにおいて、重複原稿の占める割合です。
言葉の定義を一文引用した程度であれば、引用文章は全体の1割に満たない文章量となるでしょうし、ただのコピペ記事であったり雑なリライト記事であれば重複割合は5割を超える場合もあるでしょう。

引用や転載はどこまでがセーフ?

私の考えは、数行程度は引用であると考えています。

インターネット上では引用元ページへのリンクをはることで閲覧ユーザーは自由に転載元記事を読むことが可能となります。
ただし、リンク先ページが数千文字に及ぶコンテンツ量であれば、触れている部分のみを探しだす作業は大変です。
この場合、該当部分を引用しサイト内に示すことは閲覧者の利益になりますから許されるべき範囲と言えるでしょう。

では、数ページに及ぶ膨大なコンテンツを転載した場合、閲覧ユーザーは便利だと感じるでしょうか?
答えはそうとは言い切れません。
なぜなら、転載元の原稿量が増えることで閲覧中サイト著者の意見が確認しにくくなる弊害が発生します。
膨大なコンテンツを指し示す必要がある場合、引用ではなくリンクが有効であり、コンテンツを転載することは閲覧ユーザーの利益とならないと言えるでしょう。

つまり、引用文章が長くとも自身の意見文章部が非常に多量であれば重複ではないと考える意見もありますが、ユーザー視点で考えるとボリュームが全てではないことがわかるかと思います。
通常引用元が長い場合であれば、複数の章や段落に分けることが可能かと思います。
分けた段落毎に引用を行い、意見を記述することがユーザーの見やすいコンテンツ配置であり、望まれる引用法だと考えます。

またどこまでがセーフかを考える上での線引に引用元サイトの信頼性を重視する考え方があります。
これは、リンク先サイトが消滅し、指し示す情報が不明にならないようにとの考えがベースです。
実験結果などを引用する場合で、元となる論文掲載サイトが信頼出来ないというケースは稀だと思いますので、多くの場合で反論意見の掲示において考えられます。
この場合においても、重要度の高い一節を引用しボリュームのある全文はリンクとするか、著者が引用したい記事内意見をまとめたものを例示する等し代用する選択も有り得ます。

ですから、どこまでが重複コンテンツ判定を受けない安全なボリュームかで悩んだ際には、この考えをご参考になさってください。

リライト記事の未来

引用つまり元記事をそのままコピペすることは重複コンテンツ判定を受けやすいといった点、ご理解頂けたかと思います。
そこで多くのユーザーが取り入れている手法に原稿の『リライト』があります。

これは、元記事の主張や論点は変えず語句を並び替えたり、一人称や語調を変えて重複判定を免れようとするものです。
私の考える結論は、次回アップデートでリライト判定は厳しくなりコンテンツとして認められなくなるでしょう。
早ければ年内にもありそうな次期パンダアップデートですが、リライト記事サイトはかなり順位を落とすと予想しています。

  • 一人称を変える
  • 語調を変える
  • 形容詞や副詞を加える
  • 単語を置き換える

これらはリライトで取り入れられている手法の一部です。
これら手法を用いたリライト記事は、重複コンテンツと判定される日はすぐそこまで来ていると言えます。

今回はコンテンツに関するポストとなりました。
サイト価値を高めるコンテンツSEOの手法や実施時のポイントなども近く掲載できればと思っています。

あなたの周りにリライト記事を使っている方がいれば、この記事を伝えることで感謝されるかも!?

 

関連記事

コンテンツ設計には、検索意図と本質的な希望の把握が大切

コンテンツ設計におけるサーチインテント(検索意図)と本質的な希望の違い

最近では、ウェブサイトの構築・メディアサイトの構築時に、各キーワードの検索数や難易度、ページ単位

記事を読む

404ページ設定は必要ですか?

SEOに効く404エラーページを作成しよう!WordPress設定の仕方も

古いページを削除したため404エラーが発生している場合や、誰かが張ってくれたリンクのパスが誤

記事を読む

タイピングミスを放置すると順位が落ちる?

コンテンツ内に入力ミス(誤字脱字)があるとSEO視点で減点になるの?

ブログやサイトへコンテンツの追加を行う。作業内でタイピングミスが発生し、そのまま放置されてい

記事を読む

リンクジュースってなに?

リンクジュースの説明を全力で簡単にした。

リンクジュースは、リンクの信頼性や関連性、量など異なる複数の指標を掛けあわせた評価要素を指し

記事を読む

格安料金のSEOを使う前に知っておくべきこと

激安料金のSEOサービスにはリスクが伴う

激安価格のSEOサービスはなぜ超低価格で販売が出来るのか。 このカラクリをご紹介します。

記事を読む

フラッシュサイトは検索結果から外される?

フラッシュ利用サイトは順位が落ちる?スマホ検索で【Flashを使用。お使いの端末で動作しない場合があります。】

今回のテーマは『フラッシュ(Flash)』です。 リッチなコンテンツを用意する上で重要

記事を読む

地域名SEOに再注目!

地域名でSEO!ドアウェイページが一掃されてチャンス到来?

商圏エリアが限られるビジネスをされている方々に朗報です。 地域に根ざした商売をする方にとってプ

記事を読む

コンテンツ・マーケティングってなに?

コンテンツ マーケティングとは?

コンテンツ・マーケティングはB2Bにおいても、B2Cにおいても有力な販促手法だと考えています

記事を読む

日本語のURLはSEO効果が高い?

SEO効果の高いURLの決め方。日本語?英語?数字?長さは?

もしあなたが、新規にホームページやブログを立ち上げるタイミングで、ドメインやファイル名の決定

記事を読む

相互リンクはペナルティーを受ける?

相互リンクをSEO効果目的でするとペナルティーを受けるのか?2015年現在

サイトを立ち上げて間もない頃、少しでも効果があればと相互リンク獲得に躍起になるサイトオーナー

記事を読む

 
 
no image
2022年サーチエンジンマーケティングと周辺の話

明けましておめでとうございます。2022年です。前回から2年経過です

2020年トレンド
2020年のSEOトレンド

明けましておめでとうございます。(いまさら!)毎年書いていた年始め

2019年のSEO
2019年のSEO。私が頑張りたい4要素。

昨年(2018年)は書くのを忘れました。今年は書いておこうと

Googleの個人名「ナレッジパネルの認証を受ける」の申請方法・編集

Googleで個人名検索をした際に表示される「ナレッジパネル

検索意図ドリル
コンテンツマーケティング関連本「検索意図ドリル」書きました。

ドリルを書きました。 「は?ドリル?あの漢字とかの?」 こ

→もっと見る

PAGE TOP ↑