SEOエンジニア視点でどこからが重複コンテンツ?ペナルティー対象?リライトは?

公開日: : 最終更新日:2015/06/08 SEO, コンテンツ

重複コンテンツはSEOスパム?

重複コンテンツは絶対ダメ!
ただコピー&ペーストした記事が完全なアウトであることは皆さんご承知の通り。
では、

  • 言葉の定義を一文wikiから引用したら重複かな?
  • リライトをかけたからセーフ?
  • 文字数が少ないと重複コンテンツ判定を受けやすい?

これらは、どこで線を引くべきだろうか。
そんなことをこのポストでは見て行きたいと思います。

重複コンテンツと判定されるとどうなるの?

重複コンテンツとGoogleに判定された場合、インデックス削除の対象となります。
(ここでのインデックス削除とは、一度もインデックスされない場合を含みます。)
しかし削除対象になっても、削除されるとは限りません。
サイト全体がインデックス削除されるケースや、該当ページのみがインデックス削除されるケース、インデックスはされるがページ内文章で検索にはほぼ表示されない(一定程度順位が落ちている又は検索対象からもれている)、特段の変化はなく通常のページと同様の扱いを受けるケースと多様です。

削除される場合、されない場合の差は?

インデックス削除とは、すなわち検索結果からの追放です。
同じ重複コンテンツを掲載したサイトが複数あった場合でも、ペナルティーを受けるサイトと受けないサイトがあります。
つまり、Googleによる分別がなされます。そう、贔屓があります。

この分別は何を元に判断しているのでしょうか?
大きく分けて、次のポイントです。

公開日時

コンテンツをアップした日時です。厳密にはGoogleに該当記事を見つけてもらった日時です。
より古い記事(公開日が早い)ほど元のオリジナルコンテンツである可能性が高いと言えますし、多く転載された記事の魅力に早期に気付いた執筆者であるとも言えます。

ドメインの信頼性

Googleのアルゴリズムは転載者のドメインを見ています。
大手新聞社や教育機関、行政機関のドメインサイトが引用転載した多くの場合で、重複コンテンツとしてインデックス削除を受けていないのはこの為です。
一中小企業のサイトと匿名個人ブログでも信頼性に差はあると考えます。

重複割合

重複コンテンツが掲載されたページにおいて、重複原稿の占める割合です。
言葉の定義を一文引用した程度であれば、引用文章は全体の1割に満たない文章量となるでしょうし、ただのコピペ記事であったり雑なリライト記事であれば重複割合は5割を超える場合もあるでしょう。

引用や転載はどこまでがセーフ?

私の考えは、数行程度は引用であると考えています。

インターネット上では引用元ページへのリンクをはることで閲覧ユーザーは自由に転載元記事を読むことが可能となります。
ただし、リンク先ページが数千文字に及ぶコンテンツ量であれば、触れている部分のみを探しだす作業は大変です。
この場合、該当部分を引用しサイト内に示すことは閲覧者の利益になりますから許されるべき範囲と言えるでしょう。

では、数ページに及ぶ膨大なコンテンツを転載した場合、閲覧ユーザーは便利だと感じるでしょうか?
答えはそうとは言い切れません。
なぜなら、転載元の原稿量が増えることで閲覧中サイト著者の意見が確認しにくくなる弊害が発生します。
膨大なコンテンツを指し示す必要がある場合、引用ではなくリンクが有効であり、コンテンツを転載することは閲覧ユーザーの利益とならないと言えるでしょう。

つまり、引用文章が長くとも自身の意見文章部が非常に多量であれば重複ではないと考える意見もありますが、ユーザー視点で考えるとボリュームが全てではないことがわかるかと思います。
通常引用元が長い場合であれば、複数の章や段落に分けることが可能かと思います。
分けた段落毎に引用を行い、意見を記述することがユーザーの見やすいコンテンツ配置であり、望まれる引用法だと考えます。

またどこまでがセーフかを考える上での線引に引用元サイトの信頼性を重視する考え方があります。
これは、リンク先サイトが消滅し、指し示す情報が不明にならないようにとの考えがベースです。
実験結果などを引用する場合で、元となる論文掲載サイトが信頼出来ないというケースは稀だと思いますので、多くの場合で反論意見の掲示において考えられます。
この場合においても、重要度の高い一節を引用しボリュームのある全文はリンクとするか、著者が引用したい記事内意見をまとめたものを例示する等し代用する選択も有り得ます。

ですから、どこまでが重複コンテンツ判定を受けない安全なボリュームかで悩んだ際には、この考えをご参考になさってください。

リライト記事の未来

引用つまり元記事をそのままコピペすることは重複コンテンツ判定を受けやすいといった点、ご理解頂けたかと思います。
そこで多くのユーザーが取り入れている手法に原稿の『リライト』があります。

これは、元記事の主張や論点は変えず語句を並び替えたり、一人称や語調を変えて重複判定を免れようとするものです。
私の考える結論は、次回アップデートでリライト判定は厳しくなりコンテンツとして認められなくなるでしょう。
早ければ年内にもありそうな次期パンダアップデートですが、リライト記事サイトはかなり順位を落とすと予想しています。

  • 一人称を変える
  • 語調を変える
  • 形容詞や副詞を加える
  • 単語を置き換える

これらはリライトで取り入れられている手法の一部です。
これら手法を用いたリライト記事は、重複コンテンツと判定される日はすぐそこまで来ていると言えます。

今回はコンテンツに関するポストとなりました。
サイト価値を高めるコンテンツSEOの手法や実施時のポイントなども近く掲載できればと思っています。

あなたの周りにリライト記事を使っている方がいれば、この記事を伝えることで感謝されるかも!?

スポンサーリンク

関連記事

リスティングとSEOどっちが費用対効果が良い?

リスティング広告とSEO対策どちらが優れているか?

リスティング広告とSEOのどちらを採用すべきかについて考えていきましょう。 まず設問を全否

記事を読む

ヤフー虫眼鏡の仕組みは?

ヤフー検索の虫眼鏡はどんな仕組み?

新年明けましておめでとうございます。 今年も検索エンジンマーケティングに関するポストを様々

記事を読む

URLにwwwはつけるべき?

URLはwww.があったほうがSEO効果が高い?

一昔前、ウェブサイトは大企業しか作っていない頃のお話。 この頃はウェブサイトはwww.exam

記事を読む

ブラックハットSEOってどんな意味?

ブラックハットSEOの手法を正しく理解して欲しい(切実に)

当ブログでは、内部ソースの最適化やコンテンツの最適化をテーマにした記事や、サイトの表示速度に関す

記事を読む

内部リンクの最適化方法は?

内部リンクを最適化しよう(実務者用ハイレベル)

今回は前回の2014/09/26のパンダアップデートについて(Googleアップデート)の最

記事を読む

コンテンツ最適化シートってなに?

コンテンツ最適化シートとは?(COS:Content Optimization Sheet)

オウンドメディアを立ちあげたい場合、自社サービスサイトのトラフィックを増やしたい場合、コンテ

記事を読む

上位表示されない!困った!

サイトやブログが上位表示されない時、初めに確認すべき5つのこと

あなたのサイトやブログは上位表示していますか? サイト全体で狙っているキーワード、ページ単

記事を読む

こんなSEO企業が理想だね

理想のSEO企業とは?見極めるための4つの視点

皆さんはSEO企業と一緒に仕事をする際、どのような点を考慮しているでしょうか。 ミスマッチを避

記事を読む

順位変動はアップデートによるもの?

大きな順位変動2014-12-06 アップデートがあったのか?

ここ数日、順位に大きな変動が見うけられます。(2014/12/4~12/6付近で大きな変動が

記事を読む

背景色と文字色の推奨される明度差は?

SEOスパム?守るべき背景色と文字色の明度差

先日、googleガイドラインって何?Googleガイドラインを完結にまとめてみたにおいて、

記事を読む

スポンサーリンク
スポンサーリンク
検索意図ドリル
コンテンツマーケティング関連本「検索意図ドリル」書きました。

ドリルを書きました。 「は?ドリル?あの漢字とかの?」 こ

2017年のSEOトレンド
2017年のSEOトレンド予測と重点対策ポイント

2017年に注力すべきSEO領域、新たにキャッチアップすべきSEO

SEOとキーワード数
SEOとキーワード数(メタタグ・タイトル・1ページ内)の正しい設計

この記事は、ご自身でサイト上位表示に取り組む方向けの内容です。

SEMって何?
SEMとは?SEOとの違い

ネット界隈はカタカナや3文字略称が頻繁に出てきます。 ここでは、

キーワードプランナーに仕様変更?
キーワードプランナーの不具合?稼働キャンペーンのないアカウントで検索数が正常に取得できない

今月の上旬に、キーワードプランナーに少し変更があったようです。

→もっと見る

PAGE TOP ↑