SEOエンジニア視点でどこからが重複コンテンツ?ペナルティー対象?リライトは?
重複コンテンツは絶対ダメ!
ただコピー&ペーストした記事が完全なアウトであることは皆さんご承知の通り。
では、
- 言葉の定義を一文wikiから引用したら重複かな?
- リライトをかけたからセーフ?
- 文字数が少ないと重複コンテンツ判定を受けやすい?
これらは、どこで線を引くべきだろうか。
そんなことをこのポストでは見て行きたいと思います。
重複コンテンツと判定されるとどうなるの?
重複コンテンツとGoogleに判定された場合、インデックス削除の対象となります。
(ここでのインデックス削除とは、一度もインデックスされない場合を含みます。)
しかし削除対象になっても、削除されるとは限りません。
サイト全体がインデックス削除されるケースや、該当ページのみがインデックス削除されるケース、インデックスはされるがページ内文章で検索にはほぼ表示されない(一定程度順位が落ちている又は検索対象からもれている)、特段の変化はなく通常のページと同様の扱いを受けるケースと多様です。
削除される場合、されない場合の差は?
インデックス削除とは、すなわち検索結果からの追放です。
同じ重複コンテンツを掲載したサイトが複数あった場合でも、ペナルティーを受けるサイトと受けないサイトがあります。
つまり、Googleによる分別がなされます。そう、贔屓があります。
この分別は何を元に判断しているのでしょうか?
大きく分けて、次のポイントです。
公開日時
コンテンツをアップした日時です。厳密にはGoogleに該当記事を見つけてもらった日時です。
より古い記事(公開日が早い)ほど元のオリジナルコンテンツである可能性が高いと言えますし、多く転載された記事の魅力に早期に気付いた執筆者であるとも言えます。
ドメインの信頼性
Googleのアルゴリズムは転載者のドメインを見ています。
大手新聞社や教育機関、行政機関のドメインサイトが引用転載した多くの場合で、重複コンテンツとしてインデックス削除を受けていないのはこの為です。
一中小企業のサイトと匿名個人ブログでも信頼性に差はあると考えます。
重複割合
重複コンテンツが掲載されたページにおいて、重複原稿の占める割合です。
言葉の定義を一文引用した程度であれば、引用文章は全体の1割に満たない文章量となるでしょうし、ただのコピペ記事であったり雑なリライト記事であれば重複割合は5割を超える場合もあるでしょう。
引用や転載はどこまでがセーフ?
私の考えは、数行程度は引用であると考えています。
インターネット上では引用元ページへのリンクをはることで閲覧ユーザーは自由に転載元記事を読むことが可能となります。
ただし、リンク先ページが数千文字に及ぶコンテンツ量であれば、触れている部分のみを探しだす作業は大変です。
この場合、該当部分を引用しサイト内に示すことは閲覧者の利益になりますから許されるべき範囲と言えるでしょう。
では、数ページに及ぶ膨大なコンテンツを転載した場合、閲覧ユーザーは便利だと感じるでしょうか?
答えはそうとは言い切れません。
なぜなら、転載元の原稿量が増えることで閲覧中サイト著者の意見が確認しにくくなる弊害が発生します。
膨大なコンテンツを指し示す必要がある場合、引用ではなくリンクが有効であり、コンテンツを転載することは閲覧ユーザーの利益とならないと言えるでしょう。
つまり、引用文章が長くとも自身の意見文章部が非常に多量であれば重複ではないと考える意見もありますが、ユーザー視点で考えるとボリュームが全てではないことがわかるかと思います。
通常引用元が長い場合であれば、複数の章や段落に分けることが可能かと思います。
分けた段落毎に引用を行い、意見を記述することがユーザーの見やすいコンテンツ配置であり、望まれる引用法だと考えます。
またどこまでがセーフかを考える上での線引に引用元サイトの信頼性を重視する考え方があります。
これは、リンク先サイトが消滅し、指し示す情報が不明にならないようにとの考えがベースです。
実験結果などを引用する場合で、元となる論文掲載サイトが信頼出来ないというケースは稀だと思いますので、多くの場合で反論意見の掲示において考えられます。
この場合においても、重要度の高い一節を引用しボリュームのある全文はリンクとするか、著者が引用したい記事内意見をまとめたものを例示する等し代用する選択も有り得ます。
ですから、どこまでが重複コンテンツ判定を受けない安全なボリュームかで悩んだ際には、この考えをご参考になさってください。
リライト記事の未来
引用つまり元記事をそのままコピペすることは重複コンテンツ判定を受けやすいといった点、ご理解頂けたかと思います。
そこで多くのユーザーが取り入れている手法に原稿の『リライト』があります。
これは、元記事の主張や論点は変えず語句を並び替えたり、一人称や語調を変えて重複判定を免れようとするものです。
私の考える結論は、次回アップデートでリライト判定は厳しくなりコンテンツとして認められなくなるでしょう。
早ければ年内にもありそうな次期パンダアップデートですが、リライト記事サイトはかなり順位を落とすと予想しています。
- 一人称を変える
- 語調を変える
- 形容詞や副詞を加える
- 単語を置き換える
これらはリライトで取り入れられている手法の一部です。
これら手法を用いたリライト記事は、重複コンテンツと判定される日はすぐそこまで来ていると言えます。
今回はコンテンツに関するポストとなりました。
サイト価値を高めるコンテンツSEOの手法や実施時のポイントなども近く掲載できればと思っています。
あなたの周りにリライト記事を使っている方がいれば、この記事を伝えることで感謝されるかも!?
関連記事
-
リスティング広告とSEO対策どちらが優れているか?
リスティング広告とSEOのどちらを採用すべきかについて考えていきましょう。 まず設問を全否
-
ネイティブ広告導入のデメリット。(特に運営側視点でのリスク)
今回はネイティブ広告についてです。 同内容については多くの広告業の方々がコンテンツ発信され
-
目的にあったSEO業者の選び方
社内で実施せず外部に委託しようとなった際、どのように業者選定をすると良いのでしょうか。 SEO
-
ドメイン移転の際は、.htaccessファイルでリダイレクト設定を忘れずに【必須手順】
ウェブサイトの運営過程で、サイトドメインを変更するケースもあるでしょう。 中には、あるどメイン
-
ブログの更新頻度を上げるとSEO対策効果も上がる?トップページの場合には?
あなたがブログを定期更新している場合にはきっと更新頻度で一度は悩んだことでしょう。 また、
-
モバイルフレンドリー要素追加での検索順位変動[現在のSEOへの影響]
4/21の新要素追加から早いもので1週間が経過しました。 リリース直前での案内では数日から1週
-
コンテンツSEOセミナーへのご参加ありがとうございました。
昨日(2015年2月24日火曜日)コンテンツSEOセミナーを開催させて頂きました。 急な開
-
URLの正規化はSEOの基本(wwwありなし・index.htmlありなしの統一)
今回のテーマは『URLの正規化』です。 運営開始から間もないサイトでも、運用歴の長いサイト
-
2020年のSEOトレンド
明けましておめでとうございます。(いまさら!)毎年書いていた年始めのトレンド予測、1月も下旬です
-
SEOスパム?守るべき背景色と文字色の明度差
先日、googleガイドラインって何?Googleガイドラインを完結にまとめてみたにおいて、