SEOエンジニア視点でどこからが重複コンテンツ?ペナルティー対象?リライトは?

公開日: : 最終更新日:2015/06/08 SEO, コンテンツ

   
 
   

重複コンテンツはSEOスパム?

重複コンテンツは絶対ダメ!
ただコピー&ペーストした記事が完全なアウトであることは皆さんご承知の通り。
では、

  • 言葉の定義を一文wikiから引用したら重複かな?
  • リライトをかけたからセーフ?
  • 文字数が少ないと重複コンテンツ判定を受けやすい?

これらは、どこで線を引くべきだろうか。
そんなことをこのポストでは見て行きたいと思います。

重複コンテンツと判定されるとどうなるの?

重複コンテンツとGoogleに判定された場合、インデックス削除の対象となります。
(ここでのインデックス削除とは、一度もインデックスされない場合を含みます。)
しかし削除対象になっても、削除されるとは限りません。
サイト全体がインデックス削除されるケースや、該当ページのみがインデックス削除されるケース、インデックスはされるがページ内文章で検索にはほぼ表示されない(一定程度順位が落ちている又は検索対象からもれている)、特段の変化はなく通常のページと同様の扱いを受けるケースと多様です。

削除される場合、されない場合の差は?

インデックス削除とは、すなわち検索結果からの追放です。
同じ重複コンテンツを掲載したサイトが複数あった場合でも、ペナルティーを受けるサイトと受けないサイトがあります。
つまり、Googleによる分別がなされます。そう、贔屓があります。

この分別は何を元に判断しているのでしょうか?
大きく分けて、次のポイントです。

公開日時

コンテンツをアップした日時です。厳密にはGoogleに該当記事を見つけてもらった日時です。
より古い記事(公開日が早い)ほど元のオリジナルコンテンツである可能性が高いと言えますし、多く転載された記事の魅力に早期に気付いた執筆者であるとも言えます。

ドメインの信頼性

Googleのアルゴリズムは転載者のドメインを見ています。
大手新聞社や教育機関、行政機関のドメインサイトが引用転載した多くの場合で、重複コンテンツとしてインデックス削除を受けていないのはこの為です。
一中小企業のサイトと匿名個人ブログでも信頼性に差はあると考えます。

重複割合

重複コンテンツが掲載されたページにおいて、重複原稿の占める割合です。
言葉の定義を一文引用した程度であれば、引用文章は全体の1割に満たない文章量となるでしょうし、ただのコピペ記事であったり雑なリライト記事であれば重複割合は5割を超える場合もあるでしょう。

引用や転載はどこまでがセーフ?

私の考えは、数行程度は引用であると考えています。

インターネット上では引用元ページへのリンクをはることで閲覧ユーザーは自由に転載元記事を読むことが可能となります。
ただし、リンク先ページが数千文字に及ぶコンテンツ量であれば、触れている部分のみを探しだす作業は大変です。
この場合、該当部分を引用しサイト内に示すことは閲覧者の利益になりますから許されるべき範囲と言えるでしょう。

では、数ページに及ぶ膨大なコンテンツを転載した場合、閲覧ユーザーは便利だと感じるでしょうか?
答えはそうとは言い切れません。
なぜなら、転載元の原稿量が増えることで閲覧中サイト著者の意見が確認しにくくなる弊害が発生します。
膨大なコンテンツを指し示す必要がある場合、引用ではなくリンクが有効であり、コンテンツを転載することは閲覧ユーザーの利益とならないと言えるでしょう。

つまり、引用文章が長くとも自身の意見文章部が非常に多量であれば重複ではないと考える意見もありますが、ユーザー視点で考えるとボリュームが全てではないことがわかるかと思います。
通常引用元が長い場合であれば、複数の章や段落に分けることが可能かと思います。
分けた段落毎に引用を行い、意見を記述することがユーザーの見やすいコンテンツ配置であり、望まれる引用法だと考えます。

またどこまでがセーフかを考える上での線引に引用元サイトの信頼性を重視する考え方があります。
これは、リンク先サイトが消滅し、指し示す情報が不明にならないようにとの考えがベースです。
実験結果などを引用する場合で、元となる論文掲載サイトが信頼出来ないというケースは稀だと思いますので、多くの場合で反論意見の掲示において考えられます。
この場合においても、重要度の高い一節を引用しボリュームのある全文はリンクとするか、著者が引用したい記事内意見をまとめたものを例示する等し代用する選択も有り得ます。

ですから、どこまでが重複コンテンツ判定を受けない安全なボリュームかで悩んだ際には、この考えをご参考になさってください。

リライト記事の未来

引用つまり元記事をそのままコピペすることは重複コンテンツ判定を受けやすいといった点、ご理解頂けたかと思います。
そこで多くのユーザーが取り入れている手法に原稿の『リライト』があります。

これは、元記事の主張や論点は変えず語句を並び替えたり、一人称や語調を変えて重複判定を免れようとするものです。
私の考える結論は、次回アップデートでリライト判定は厳しくなりコンテンツとして認められなくなるでしょう。
早ければ年内にもありそうな次期パンダアップデートですが、リライト記事サイトはかなり順位を落とすと予想しています。

  • 一人称を変える
  • 語調を変える
  • 形容詞や副詞を加える
  • 単語を置き換える

これらはリライトで取り入れられている手法の一部です。
これら手法を用いたリライト記事は、重複コンテンツと判定される日はすぐそこまで来ていると言えます。

今回はコンテンツに関するポストとなりました。
サイト価値を高めるコンテンツSEOの手法や実施時のポイントなども近く掲載できればと思っています。

あなたの周りにリライト記事を使っている方がいれば、この記事を伝えることで感謝されるかも!?

 

関連記事

2016年最新SEOトレンドは、この4つをおさえるべし

2016年も始まって2週間。やっと今年1記事目の高橋です。 今年もよろしくお願いします。

記事を読む

優秀なSEOコンサルはこうあるべきだ

SEOコンサルなら強く発信し、意見は断定的であれ!

普段書かないようなポストを。 SEOとは、正解が見えないものです。ブラックボックスのアルゴ

記事を読む

ネイティブ広告記事を掲載するデメリットは?

ネイティブ広告導入のデメリット。(特に運営側視点でのリスク)

今回はネイティブ広告についてです。 同内容については多くの広告業の方々がコンテンツ発信され

記事を読む

Google検索に引っかからない時の対処法

検索に引っかからない時、サイト管理者が確認すべきこと

あなたのサイト(ホームページ)やブログが検索エンジンに引っかからない場合、このポストにそいチ

記事を読む

リンクジュースってなに?

リンクジュースの説明を全力で簡単にした。

リンクジュースは、リンクの信頼性や関連性、量など異なる複数の指標を掛けあわせた評価要素を指し

記事を読む

コンテンツSEOセミナー開催しました(過去形)

コンテンツSEOセミナーへのご参加ありがとうございました。

昨日(2015年2月24日火曜日)コンテンツSEOセミナーを開催させて頂きました。 急な開

記事を読む

リンクネットワークって何?

リンクネットワークとは?SEOスパムに無意識に参加するリスク

知らずにリンクネットワークとつながり、手動スパム判定を受けることのないよう注意が必要です。

記事を読む

プログレッシブ エンハンスメントとは?

プログレッシブ エンハンスメントとは?Googleの推奨するサイト構築法

2014年10月末にGoogleはウェブマスター向けに技術に関するウェブマスター向けガイドラ

記事を読む

alt属性の最適化でSEO効果は?

alt属性にSEO効果を期待するなかれ

alt属性について誤った理解をされているケースが散見されますが、alt属性は写真や画像が表示

記事を読む

モバイルフレンドリーで大きな影響は出た?

モバイルフレンドリー要素追加での検索順位変動[現在のSEOへの影響]

4/21の新要素追加から早いもので1週間が経過しました。 リリース直前での案内では数日から1週

記事を読む

 
 
no image
2022年サーチエンジンマーケティングと周辺の話

明けましておめでとうございます。2022年です。前回から2年経過です

2020年トレンド
2020年のSEOトレンド

明けましておめでとうございます。(いまさら!)毎年書いていた年始め

2019年のSEO
2019年のSEO。私が頑張りたい4要素。

昨年(2018年)は書くのを忘れました。今年は書いておこうと

Googleの個人名「ナレッジパネルの認証を受ける」の申請方法・編集

Googleで個人名検索をした際に表示される「ナレッジパネル

検索意図ドリル
コンテンツマーケティング関連本「検索意図ドリル」書きました。

ドリルを書きました。 「は?ドリル?あの漢字とかの?」 こ

→もっと見る

PAGE TOP ↑