【Gの悲劇】 無断転載で検索結果から吹き飛ばされる理由
【ご注意・ご免責事項】
こちらの記事は、2016年7月現在に書いたものです。
ご覧になっている時には古くなっている可能性もありますのでご注意下さい。
私の記憶では、パンダ・ペンギンアップデート前のGoogleは、『 誰が一番最初にこの記事を書いたのか 』 について、かなり正確に判断していました。
確かに、一部でRSSなどから記事を盗用して、先にインデックス登録してしまうことで、検索結果に反映される順位を変えてしまうことが行われていましたが、そう言うのはかなり稀なケースで、一般的には、インデックスに反映された順番が、オリジナルのものとして反映されやすかったように記憶しています。
今でも、MSNではオリジナルの記事はそのような反映のされ方をしていますが、日本での検索シェアが低すぎて意味が無い状態になってしまっています。
ところが、パンダ・ペンギンアップデート以降は、それが狂ってしまいました。
そのきっかけになったのが、ドメインパワーの重視です。
パンダ・ペンギンアップデートでは、多くのサイトがその網に引っかかり、尽くペナルティを受けるに至りました。
ですので、今では考えられない話ですが、公的機関のページや公式サイトのような重要なサイトが検索結果から弾き飛ばされたり、たまたま網にかからなかった弱小ブログに検索結果で競り負けるなんてことも起こっていました。
パンダ・ペンギンアップデートを行った当のGoogle自身のページですら、何らかのペナルティにより、検索順位に競り負けてしまうことがありました。
当時はそれを見てケラケラと大笑いをしていたものでした。
しかし、それは地獄の一丁目でした。
この問題を解決するためにGoogleがとった方法が、何と『 ドメインパワーの重視 』 でした。
ある程度以上のドメインパワーのあるドメインはペナルティの基準を緩和したようで、その変更が行われて以降は、公式ページや公的な機関のページが競り負けることはほとんどなくなりました。
しかし、パンダ・ペンギンアップデートで引っかかってしまったドメインパワーの弱いブログやサイトにとって、それは 『 致命傷 』 になりました。
後から、記事作成後から数年も経った後に盗用・引用・転載したドメインパワーの強いページに対しても、検索結果で競り負けることが増えてきたのです。
数年後に追加されたページですら競り負けるところまでくると、先に頑張ってオリジナルの記事を書いたもの負けになってしまいます。
なぜ?日本で独占禁止法が適用されない理由
日本では検索の分野については、独占禁止法が適用されていません。
独占禁止法とは、特定の分野において、ある一企業のシェアが高すぎて、独占的に企業経営できてしまっているのを禁止する法律です。
どうしてこんな法律があるのかと言うと、その企業が好き勝手やっていても、国民はそれ以外に選ぶことが出来ないからです。
日本では、Yahoo Japan の検索がGoogleの検索を元にしています。
現在の日本では、MSNで検索をかける人はほとんどいないため、実質的には、Google検索で検索する人が日本人の9割以上に達している状態になっています。。
欧米では、独占禁止法でGoogle検索のシェアが高くなりすぎることが禁じられていますが、日本では、Google検索について独占禁止法が適用されていないため、Google検索で何らかのペナルティを受けてしまうと、日本国中の検索結果の全てから削除されてしまうと言う、『 絶望的な状態 』 になってしまいます。
一応、国会でこの件について審議されたことはありましたが、ペナルティの基準はGoogle検索とYahoo検索では異なるなどの理由から、独禁法で取り締まられないまま放置されることとなりました。
しかし、実際には、自動ペナルティや重複判定は共通のを使っているため、Google検索からもYahoo検索からも弾き飛ばされてしまっています。
(2016年7月現在)
どのような記事の盗用・無断転載・引用で検索結果から吹き飛ばされるのか
記事の盗用・無断転載・引用によって、検索結果で吹き飛ばされることが多いです。
では、どのような方法で記事の盗用・無断転載・引用が行われるのでしょうか。
現在主流となっている、幾つかの記事の盗用・無断転載・引用方法について書き出してみました。
ワードサラダ
ワードサラダとは、単語や文節がランダムに配置されていて、通しで見ると意味不明な文章になっているものです。
その多くが、狙ったキーワードを詰め込んだ文章です。
文章を自動で生成するのは大変ですので、検索結果で上位のサイトやブログから一部ずつ文章を拾ってきて、文章を生成します。
でも、幾つものサイトやブログから拾ってきた細切れの文章から自動生成で作った文章ですので、通しで読むと文章の意味は通らないことが多いです。
Aブログの文章、Bブログの文章。
Cブログの文章、Dブログの文章、Eブログの文章。
人間が見たら『 ? 』 なワードサラダブログであっても、現在のクローラーや検索アルゴリズムはそれを見分けることが出来ません。
しかも、ワードサラダの多くが無料ブログや無料ブログに https://***.***.xyz などの大量の格安ドメインを割り当てて使っており、ワードサラダを手動で見つけても、ドメイン単位でペナルティを課すことは困難です。
ワードサラダに使われている文を検索すると、同様のワードサラダブログが芋づる式にズラズラと発見できることがありますが、普通、Googleはそこまでのことはしません。
だだし、それを無料ブログの運営会社に通報すれば、規約違反にて、そのワードサラダブログが削除される可能性はあります。
でも、そんな下らない作業をしても一銭の得にもならない上に、ワードサラダブログを作っている人は、ツールを使って大量にワードサラダ記事やブログを作成しますので、懲罰的な賠償金のとれない日本においては、作業し損になる可能性が高いです。
そして、それを放置していると、元記事のページに検索結果で競り勝ってしまい、元記事の方が検索結果から吹き飛ばされるなどの悲劇が起きやすくなります。
ちなみに、これは典型的な機械的な記事の量産行為(スパム行為)ですので、逆SEO(ターゲットサイトやブログを検索結果から弾き飛ばす)として使われることもあります。
ですので、悲しいかな、被害者であるはずの元記事がペナルティを受け、検索結果に全く出てこなくなることも起こり得ます。
(人的にペナルティを付与する手動ペナルティの場合、ワードサラダかどうかがわかりやすいので誤ペナルティが起きにくいが、検索アルゴリズムによる自動ペナルティの場合、Googleのアルゴリズムではワードサラダの記事かどうかの判別ができないため、誤ペナルティが起きやすい)
Q&Aサイトに無断転載
引用元のURLを貼らずに、ヤフー知恵袋やGooなどのQ&Aサイトに無断転載します。
点数稼ぎやアクセス数稼ぎのために、業者がやることもあります。
上記のワードサラダと同様、ドメインパワーで負けて検索結果で競り負けたり、重複した記事としてペナルティを受けたりします。
通常は、後から追加したページのほうがペナルティを受けるのが常道だと考えがちですが、ドメインパワーの強さをメインに考える現在のアルゴリズムのあり方では、Q&Aサイトに無断転載されてしまった場合、ドメインパワーで競り負けてしまい、先に作成したオリジナルページの方が重複判定を受けて圏外に吹き飛ばされます。
また、転載や引用の基準が緩い Q&Aサイトから安易に別のサイトやブログへ転載や引用をされてしまうと、いよいよ自サイトが検索結果から吹き飛ぶ可能性が高くなります。
無料レンタルサーバーに無断転載
無料のレンタルサーバーは様々な人が利用します。
大抵はそこそこの個人ブログだったりするのですが、中には結構なアクセスを集める無料のレンタルブログもあります。
大手まとめサイトや芸能人や政治家や有名人や経営者なども利用していることもあり、かなりのドメインパワーを持っています。
そんな無料のレンタルサーバーのドメインのブログに自分の書いたものとして丸ごとコピーペーストされてしまうと、ドメインパワーで競り負けてしまい、圏外に吹き飛ばされやすくなります。
また、どこぞの会社の支店が、勝手に他人の記事を自分のものとして無料ブログで公開するケースもあります。
会社の支店の従業員のブログとして、強力な co.jp のドメインから被リンクを受けているケースもあり、そう言う場合にも簡単に記事が吹き飛ばされてしまいます。
キュレーションサイトへの引用
キュレーションとは、複数のページから重要だと思う部分を抜き出し、一つのページとして構成しなおすことです。
例えば、Aサイトからは、●●●●●●●●●●と言う文章を、Bサイトからは▲▲▲▲▲▲▲▲▲▲▲▲▲と言う文章を、Cサイトからは■■■■■■■■■■■■と言う文章を抜き出してきます。
それぞれ、コアな部分を抜き出してきます。
そして、1ページにまとめます。
通常、引用したサイトの情報やリンクは 『 ものすごく小さく背景色と同化した文字 』 が使われます。
また、『 引用した文章とオリジナルの文章と区別がつきにくい状態で引用 』 されることも多いです。
(そもそもオリジナルの文章が存在していないページも多数存在する)
これにより、何も知らない閲覧者はその文章が引用されたものであることに気が付かず、まるで、そのページを作成した本人が作成した文章や写真のように誤認しやすくなります。
さらに、写真の場合の問題はより深刻で、Cサイトからは芸能人のDさんの写真を、EサイトからはDさんの別の写真を引用して表示します。
見る側は、複数のサイトを巡らずとも短時間でパパッと芸能人のDさんの写真を閲覧することが可能なので、大変に便利です。
でも、写真や画像のキュレーションの場合、全文を読まずとも写真を見るだけでだいたいのことが把握できてしまうため、写真や画像をこのような形で 『 引用 』 されてしまうと、サイトのアクセスが致命的に減少してしまう可能性が高く、それで収益を得ている場合は死活問題に発展します。
引用の定義としては、自分の文章が主で引用が従になりますので、引用だけで構成されているキュレーションサイトは本来であれば 『 引用 』 には当たりません。
また、Twitterなど、コメントや画像を表示するコードをそのまま転載する形での引用であれば許可されている場合を除き、編集やまとめと言う形で、引用のみで成立したページへの許可なしの引用は本来はダメなのですが、現在は、なし崩し的に許可されているような状態です。
(著作権侵害での刑事告訴や損害賠償請求をしているサイトオーナーさんもおられるようですが、ごく一部なので影響は軽微です)
キュレーションサイトは、自分で何かを実験したり、調査したり、文章を書いたりするわけではないので、短時間に大量のページを作成することが可能です。
でも、検索結果から人が流れてくる場合、まだダメージも少なめです。
ところが、大手のキュレーションサイトはドメインパワーがかなり強いことが多いです。
リクルートなどの上場企業ですら、キュレーションをやっているケースもあります。
そんなキュレーションサイトに無断で引用されてしまうと、通常の個人や零細企業のやっている程度のドメインは、ドメインパワーで競り負けます。
しかも、検索結果で上位であり続けると、一つや二つの引用だけでは済みません。
複数箇所・複数回に渡り、何度も何度も転載されます。
そうなると、かなり検索結果が強かったページでも、さすがに検索結果から吹き飛びやすくなります。
大手掲示板への無断転載
URLを貼らず、大手掲示板に記事内の文章が無断転載されるケースも多いです。
URLを貼ることが禁止されているURLだったり、URLを貼らずに適当に転載していたりと、転載する理由は様々です。
(FC2やライブドアブログなどは、大量にリンクが貼られる転載荒らし防止の為、NGワード化されていることもある)
また、無料のレンタルブログへの転載だけでなく、大手掲示板などに無断転載されたあと、複数のまとめブログなどに再転載されることも起こります。
いずれにしても、ドメインパワーにもよりますが、このようにURLもなしで何度も何度も無断転載されてしまうと、ドメインパワーで負けているサイトは吹き飛びやすくなります。
クラウドソーシングによる盗用や記事のリライト
クラウドソーシング( crowd sourcing )と言うのは、会社や個人が、一般の個人に広く仕事を発注する業務発注&請負システムです。
crowd 群衆
sourcing 業務委託
クラウドソーシングには様々な仕事があるのですが、その中には、『 ●●●についての記事を書いてくれ 』 と言うものがあります。
これがかなりの曲者でありまして、発注する側も発注される側も、著作権についてはそんなに気することもなく、検索上位に上がっている記事をリライトして発注した人に納品します。
そして、受注する側もそうやってリライトされただけの記事をよく調べもせずに掲載してしまいます。
万が一、オリジナル記事を書いた側の人から文句がくれば、『 外注した人がやった、申し訳ない 』 と適当に謝罪して済ませます。
(訴訟を起こしても訴訟損になる可能性が高く、刑事告訴は敷居が高いので、通常はこれで済まされることが多いです)
ちなみに、リライトとは 『 記事の一部をちょっとだけ書き直したもの 』 です。
例えば、このような感じです。
●●●は▲▲▲になりますので、■■■にしないといけません。
↓
●●●は▲▲▲になりましたので、■■■にしないといけないそうです。
どっちもほとんど同じなのですが、ほんの少しだけ違っています。
だいたい、文章の8〜9割が同一で、接続詞や文末などを1〜2割だけ変えた文章が多いです。
このようなリライト記事は一つのサイトに一記事だけではなく、一つの記事を複数のサイトに提供していることもあり、いよいよ検索結果から吹き飛ばしやペナルティへの道が近くなっていきます。
ただし、格安クラウド記事作成請負人に仕事を発注する方が、一からページを作成するよりも簡単に大量のページを作成できてしまいます。
また、記事作成の時間をひたすらSEOに注力すると、ドメインパワーもつき始め、事業が軌道に乗り始めます。
すると、さらに大々的にクラウドソーシングを使った事業の拡大ができるようになります。
同じクラウドソーシングの記事を掲載しているのか、検索ワードによっては、ほぼ同じ文章のページが複数掲載されています。
(そこまでいくと、最早どのページがオリジナルだったのかなんてわからないし、実はオリジナルのページの方はペナルティで吹き飛ばされている可能性も高い)
普通の手法で一個人や零細企業が吹き飛ばされないドメインを作ることは困難
このように、最早、現在は無断転載で検索結果から吹き飛ばされないようにする事自体、とても困難な状態です。
Googleは、『 その道のオーソリティになる 』 ことを提唱しています。
要するに、専門家がその道の専門の記事を書けばいい、そうすれば自ずと強いドメインパワーの与えられている有名所からドメインパワーが与えられ、無断転載、無断コピーにも検索結果で競り勝つだろうと言う理論です。
この理論から言うと、その道のオーソリティにならなければなりません。
でも、その道のオーソリティになるまでには、有名にならなければなりません。
ニュースに載る、何らかの実験成果を出して世に認められる、本人が撮影した写真のオリジナルが評価されるなどなどです。
でも、殆どの人はここまではできません。
確かに、本業のある大学や公的機関に努めている学者が、本業の一環で得たデータを公表するなどすれば、このようにすることはできるでしょう。
しかし、例えば、一個人や零細企業が色々と工夫して部屋の気温を下げる実験を行ってそのデータを公表したり、実地調査を行ったり図書館の本で得た情報を元に何日も何週間もかけてページを作っても、それをドメインパワーの強いサイトやブログに盗用・転載・引用されてしまうと、検索結果から簡単に吹き飛ばされてしまうため、頑張った苦労が水の泡になっています。
そんな中、オーソリティになれ、さもないと検索結果で吹き飛ばされてしまっても仕方ないのだなとと言われても、普通は困ってしまうわけです。
最終的な問題の行き着く場所
このような状態が起きることで発生する問題が、オリジナルの記事を作成している人のモチベーションの低下です。
頑張ってオリジナルの記事を書く
→ 検索結果で一時的に上位
→ あっという間に盗用と転載と引用の餌食
→ オリジナルのはずの自分が検索結果から吹き飛ばされる
→ 自分の記事や写真の盗用・転載・引用を行ったサイトがアクセス数を総取り
これが続くと、根気と根性のある人でもさすがに心が折れてしまいます。
確かに、情報の拡散が一番の目的ならば、自分の拡散したい情報さえ拡散してしまえばそれでよいのですが、情報の拡散が主目的なのではなく、自分が書いた記事と自分が認められること、その記事を書き、公表するために必要だった経費を稼ぐことが主目的なのであれば、これが起きることで、大幅にモチベーションが低下します。
そして、鴨となるオリジナルを書く人がいなくなるまでこれは続き、最終的には、オリジナルの記事がほとんど出てこない状態に至ります。
まあ、そう言う世界でも良いと言うのであれば、それでも良いのかもしれないですが、そう言う世界では問題なのであれば、何らかのアクションが必要です。
次ページ
前ページ
広告
- Googleの被リンクスパムへのペナルティは独禁法違反か?
- 【2017年予測】 腐っていくGoogle検索対策と新しい集客法について
- 画像や写真の無断コピーと無断引用を防止する方法
- リライトチェックツールで改変型コピペを発見する
- 【Gの悲劇】 無断転載で検索結果から吹き飛ばされる理由
- 【高頻度ページ量産無双】 Googleのパンダ・ペンギンでも生き残る方法
- 【盗用防止】 記事をコピペさせない方法 【引用防止】
- 【実名公表】 Google DMCA申請の問題点 【パクリページはそのままに】
- 【申請取り消し】 DMCAで公開された実名の削除
- 【ドメインパワー】 レンタルブログとSEO 【爆速インデックス】
- 【検索結果を正常化】 サイトをHTML5対応してみた
- 【ページ名】 HTML5対応後の検索結果の変化 【検索結果】
- 【続々】 サイト移転の恐怖
- 【続】 サイト移転の恐怖
- 検索結果に画像を含ませない方法
- サンドボックスエフェクトの恐怖