SEOエンジニア視点でどこからが重複コンテンツ?ペナルティー対象?リライトは?

公開日: : 最終更新日:2015/06/08 SEO, コンテンツ

   
 
   

重複コンテンツはSEOスパム?

重複コンテンツは絶対ダメ!
ただコピー&ペーストした記事が完全なアウトであることは皆さんご承知の通り。
では、

  • 言葉の定義を一文wikiから引用したら重複かな?
  • リライトをかけたからセーフ?
  • 文字数が少ないと重複コンテンツ判定を受けやすい?

これらは、どこで線を引くべきだろうか。
そんなことをこのポストでは見て行きたいと思います。

重複コンテンツと判定されるとどうなるの?

重複コンテンツとGoogleに判定された場合、インデックス削除の対象となります。
(ここでのインデックス削除とは、一度もインデックスされない場合を含みます。)
しかし削除対象になっても、削除されるとは限りません。
サイト全体がインデックス削除されるケースや、該当ページのみがインデックス削除されるケース、インデックスはされるがページ内文章で検索にはほぼ表示されない(一定程度順位が落ちている又は検索対象からもれている)、特段の変化はなく通常のページと同様の扱いを受けるケースと多様です。

削除される場合、されない場合の差は?

インデックス削除とは、すなわち検索結果からの追放です。
同じ重複コンテンツを掲載したサイトが複数あった場合でも、ペナルティーを受けるサイトと受けないサイトがあります。
つまり、Googleによる分別がなされます。そう、贔屓があります。

この分別は何を元に判断しているのでしょうか?
大きく分けて、次のポイントです。

公開日時

コンテンツをアップした日時です。厳密にはGoogleに該当記事を見つけてもらった日時です。
より古い記事(公開日が早い)ほど元のオリジナルコンテンツである可能性が高いと言えますし、多く転載された記事の魅力に早期に気付いた執筆者であるとも言えます。

ドメインの信頼性

Googleのアルゴリズムは転載者のドメインを見ています。
大手新聞社や教育機関、行政機関のドメインサイトが引用転載した多くの場合で、重複コンテンツとしてインデックス削除を受けていないのはこの為です。
一中小企業のサイトと匿名個人ブログでも信頼性に差はあると考えます。

重複割合

重複コンテンツが掲載されたページにおいて、重複原稿の占める割合です。
言葉の定義を一文引用した程度であれば、引用文章は全体の1割に満たない文章量となるでしょうし、ただのコピペ記事であったり雑なリライト記事であれば重複割合は5割を超える場合もあるでしょう。

引用や転載はどこまでがセーフ?

私の考えは、数行程度は引用であると考えています。

インターネット上では引用元ページへのリンクをはることで閲覧ユーザーは自由に転載元記事を読むことが可能となります。
ただし、リンク先ページが数千文字に及ぶコンテンツ量であれば、触れている部分のみを探しだす作業は大変です。
この場合、該当部分を引用しサイト内に示すことは閲覧者の利益になりますから許されるべき範囲と言えるでしょう。

では、数ページに及ぶ膨大なコンテンツを転載した場合、閲覧ユーザーは便利だと感じるでしょうか?
答えはそうとは言い切れません。
なぜなら、転載元の原稿量が増えることで閲覧中サイト著者の意見が確認しにくくなる弊害が発生します。
膨大なコンテンツを指し示す必要がある場合、引用ではなくリンクが有効であり、コンテンツを転載することは閲覧ユーザーの利益とならないと言えるでしょう。

つまり、引用文章が長くとも自身の意見文章部が非常に多量であれば重複ではないと考える意見もありますが、ユーザー視点で考えるとボリュームが全てではないことがわかるかと思います。
通常引用元が長い場合であれば、複数の章や段落に分けることが可能かと思います。
分けた段落毎に引用を行い、意見を記述することがユーザーの見やすいコンテンツ配置であり、望まれる引用法だと考えます。

またどこまでがセーフかを考える上での線引に引用元サイトの信頼性を重視する考え方があります。
これは、リンク先サイトが消滅し、指し示す情報が不明にならないようにとの考えがベースです。
実験結果などを引用する場合で、元となる論文掲載サイトが信頼出来ないというケースは稀だと思いますので、多くの場合で反論意見の掲示において考えられます。
この場合においても、重要度の高い一節を引用しボリュームのある全文はリンクとするか、著者が引用したい記事内意見をまとめたものを例示する等し代用する選択も有り得ます。

ですから、どこまでが重複コンテンツ判定を受けない安全なボリュームかで悩んだ際には、この考えをご参考になさってください。

リライト記事の未来

引用つまり元記事をそのままコピペすることは重複コンテンツ判定を受けやすいといった点、ご理解頂けたかと思います。
そこで多くのユーザーが取り入れている手法に原稿の『リライト』があります。

これは、元記事の主張や論点は変えず語句を並び替えたり、一人称や語調を変えて重複判定を免れようとするものです。
私の考える結論は、次回アップデートでリライト判定は厳しくなりコンテンツとして認められなくなるでしょう。
早ければ年内にもありそうな次期パンダアップデートですが、リライト記事サイトはかなり順位を落とすと予想しています。

  • 一人称を変える
  • 語調を変える
  • 形容詞や副詞を加える
  • 単語を置き換える

これらはリライトで取り入れられている手法の一部です。
これら手法を用いたリライト記事は、重複コンテンツと判定される日はすぐそこまで来ていると言えます。

今回はコンテンツに関するポストとなりました。
サイト価値を高めるコンテンツSEOの手法や実施時のポイントなども近く掲載できればと思っています。

あなたの周りにリライト記事を使っている方がいれば、この記事を伝えることで感謝されるかも!?

 

関連記事

ファイルの転送速度を上げるgzip圧縮

Page Speed Insightsの点数を上げる「圧縮を有効にする」の方法説明

昨年末に投稿したページ表示速度の改善方法【続編】内にて、gzip圧縮や画像の最適化について触れて

記事を読む

改善方法【続編】

ページ表示速度の改善方法【続編】

前回(SEO効果あり!ページ表示速度の改善方法)に引き続き、ページの表示速度改善を実例を含め

記事を読む

ウェブライターの報酬を増やすには?

WEBライターが収入を増やすには、SEOライターの上を目指すべき

もしあなたが、WEBメディア向けや企業サイト向けのライティングをしているのなら、数分で読める

記事を読む

SEOの要因に直帰率は含まれるの?

SEOとの関係性。直帰率が高い、離脱率が高いと順位は落ちる?

この記事では、一般的なWEBサイトやLPへオーガニック経由でアクセスがあった場合の直帰率や離

記事を読む

レスポンシブデザインはGoogle推奨なの?

レスポンシブデザインはSEOに有利?WordPress等のCMSでは?

この記事は、既に保有するサイトをレスポンシブ化しようか、または新規作成するサイトをレスポンシ

記事を読む

日本語のURLはSEO効果が高い?

SEO効果の高いURLの決め方。日本語?英語?数字?長さは?

もしあなたが、新規にホームページやブログを立ち上げるタイミングで、ドメインやファイル名の決定

記事を読む

サーバー変えるだけで順位が上がる?

SEOとサーバーの関係性。SEOに強いサーバーはあるのか?

SEO知識を高めることに多くの時間や費用を掛けているサイト管理者であるにも関わらず、そのサイ

記事を読む

同義語や類語とSEOの関係

同義語や類語や対義語を上手に使うとSEO効果があるのか?

Googleはコンテンツジャンルをアルゴリズムで判別しています。 では、そのアルゴリズムで

記事を読む

エグジフ情報をGoogleは読んでるの?

検索エンジンはExif情報(画像ファイルのプロパティ)を取得しているかの実験

今回は画像ファイルにあるExif情報を検索エンジンは読み込み、検索結果を決定する上で使用して

記事を読む

bとstrongの違い

bタグとstrongタグの違いをSEO観点とhtml(html5)観点で分かりやすく

今回はbタグとstrongタグ、その関連タグについて扱います。今回登場するタグは <

記事を読む

 
 
no image
2022年サーチエンジンマーケティングと周辺の話

明けましておめでとうございます。2022年です。前回から2年経過です

2020年トレンド
2020年のSEOトレンド

明けましておめでとうございます。(いまさら!)毎年書いていた年始め

2019年のSEO
2019年のSEO。私が頑張りたい4要素。

昨年(2018年)は書くのを忘れました。今年は書いておこうと

Googleの個人名「ナレッジパネルの認証を受ける」の申請方法・編集

Googleで個人名検索をした際に表示される「ナレッジパネル

検索意図ドリル
コンテンツマーケティング関連本「検索意図ドリル」書きました。

ドリルを書きました。 「は?ドリル?あの漢字とかの?」 こ

→もっと見る

PAGE TOP ↑