リライトチェックツールで改変型コピペを発見する

一昔前であれば、コピーペーストそのまま行っていた。
もちろん、今でもコピーペーストは普通に存在するが、現在の主流『 リライト 』だ。

リライトとは『 元の文章を書き換える 』ことだ。
たとえば、このような文章があったとする。

なので、便秘がちな方は、玄米に含まれている食物繊維たっぷりのこの米糠の部分を食べるとお通じが良くなりやすいです。

でも、元々便秘がちでなかったりお腹がゆるめの方が玄米を食べますと、未消化になりやすくなります。

【繊維質】 玄米を消化するために 【未消化】

これをこのように改変する。

ですので、便秘がちな方は、玄米に含まれております食物繊維たっぷりのこの米糠の部分を食べるとお通じが良くなるようです。

しかしながら、元々便秘がちではない方が玄米を食べると、未消化になりやすいそうです。

このような作業が 『 リライト 』と呼ばれる作業だ。
この場合、まだまだ文章の一致率が高い。
なので、もっと改変しないと、元の文章を書いた著作権者から苦情が来てしまう。

ですので、玄米の食物繊維たっぷりの米糠(こめぬか)を食べると、便秘がちな人は便通が改善します。

しかしながら、特に便秘がちでなく、それどころかお腹がゆるい人が玄米を食べると、未消化になりますのでご注意下さい。

このように変更すると、かなりコピペ率が低くなる。
しかも、コピペ元の文章Google検索しても、検索にはなかなか引っかからない。

なので、著作権者がリライトした記事を発見するのは、たいてい自分が元々強かったキーワードでリライト記事がのし上がってきた時だったりする。

そんな時に便利なのが『 リライトチェックツール 』 だ。
これは、インターネット上に『 公開されている文章 』 と『 自身が検索した文字列 』 の『 一致率 』 を調査するためのツールだ。

例えばこれ。
無料枠だとチェックできる文字数やスピードが低くなるが、元文章とコピーページの一致率などを調べられる。


コピペチェックツール【Copydetect】文章のコピーチェックや盗用チェックに。

料金・お申し込み【CopyDetect】



フリー2000文字までチェックできる。
200文字以上で検索をしないと作動しないので要注意。
有料だと4000字まで開設できるらしい。
(2016年9月現在)

試しに何度か使ってみたところ、なかなか良さ気な感じではあった。
時間がかかるのが難点だだったが、無料でこれだけ使えるのであれば大満足だ。




Wordpress向けプラグインも公開されているようなので、Worpdressのプラグインとして使うのも良いかもしれない。
(Wordpress向けプラグインの方は動作保証外らしい)


Wordpress向けのコピーチェックプラグインを公開しました - CopyDetectブログ


その他、こう言うツールもある。


コピペチェックツール『影武者』


記事のオリジナル度の高さ(?)で定評のある『 Shinobiライティング 』で使用しているようだ。

このツールの主な使用目的は、記事作成依頼をしたのにコピペや極簡単なリライトしかせずに納品する悪徳な仕事の受注者拒否することだ。

このツールにかけることで、どこかからコピペされた文章が含まれていないかどうかを、簡単に確かめることができる。


コピペチェックツール『影武者』|ご利用プラン


このツールの場合最安のプランでも、4,000円以上する。
(2016年9月現在)

結構高い。
速度や使い勝手などは、使ったことがないのでわからない。


コピペチェックツールの問題点

コピペチェックツールは優秀なツールではあるが、いくつかの問題点もある。
それは以下の通り。


複数ページから少しずつコピー&リライトされていると検出しにくい

1ページからのコピー割合が低く、複数のページからコピー&リライトしている場合は、一致率が大幅に低下する。

例えば、サイトAからは300文字程度をコピーしてリライト。
サイトBからは250文字程度をコピーしてリライト。
それを、合計10サイトから行う。

すると、検索結果の上位サイトでよく見られる、やたらと長く、今ひとつ何が言いたいのかわからない、超・長文のキュレーションページが完成する。



リライト率が高くとも著作権の侵害を立証しにくい

コピー&リライトしたページに具体的な実験データがそのまま使われていたり、画像や写真の元データがある場合は著作権侵害の立証がしやすい。

しかし、ただ単に現地に行ったり書籍や資料を買い漁って調べたものを公表したものは、オリジナルの記事作成者が手間暇・お金をかけていても、リライトされてコピペ率が大幅に低い場合は、著作権侵害の立証が難しくなる。


ある程度の目星をつけていないと発見できない

例えば、どうしてもコピペされたくないページが5ページしかない場合、その5ページを時々チェックしてやれば事足りる。

でも、これが500ページ、5000ページとなってくると、この方法でチェックするのは非常に困難になる。

確かに、依頼したリライト記事がどこかから丸ごとコピペされていないかどうかをチェックするにはこのツールは便利だが、ページ数が多くなればなるほど、元記事が盗用されているかどうかをチェックするのは非常に難しくなる。


結局のところ

リライトされた文章を発見できたところで、リライト系の記事の盗用を立証する事が難しいとなると、オリジナルの記事を書く側はかなりの苦境に立たされる可能性が高い。

しかも、日本では、著作権侵害が立証できたとしても、民事訴訟勝訴で得られる金額は非常に少ない。

リライトの技術は年々向上していっている。
多くのページから少量ずつ文章を抽出、リライト作業でGoogle検索で引っかからないようにして著作権者から発見されるのを防ぐ、リライトチェックツールでコピー割合をある程度以下に抑えるなどなど。

しかも、DeNAなど、上場企業までもがこの手のリライト系のキュレーション事業に乗り出している

このような大型のキュレーションサイトの中には、クラウドワークスなどの一般人への仕事発注サービスにより、キュレーションの仕事を外注して、大量のキュレーションページを量産している場合がある。
(クラウドワークスには、仕事のカテゴリの中に『 リライト 』がある)

この他、自動リライトツールなるものも発売されている。
この自動リライトツールを使うと、リライトページを量産することができる。
ここまでくると、最早SEOスパムに近くなる。

自動リライトツールで作成されたページは、意味は今ひとつわからないが、ワードサラダほどメチャメチャなページにはならない。

これら異常な状態を回避するには、従来の方法ではダメで、『 テキストを使ったWEBサイトやブログではない何か 』を使って情報公開していくしかない。

それか、ほとんどお金にはならないが、お金になりにくい分野はみんながキュレーションをしたがらないため、お金になりにくい分野で勝負すると、このようなリライト被害には遭いにくくなる。

この他、検索には引っかかりにくくなってしまうが、重要な部分を画像化すると言うのはありではないかと思う。

画像や写真はどれほどコピー防止措置をとったところで、画像キャプチャーなどで簡単に盗用できてしまうため、Photoshopなどの画像加工ソフトを使い、ロゴやURLなどの『 透かし 』『 マーク 』 などをトリミングで消されない位置に配置する必要がある)



ちなみに、このような形で Photoshop Elements でURLやロゴの『 透かし 』 を入れたものは、ほとんど盗用されていない。
(Googleの画像検索にかけても出てこない)

恐らく、引用として自サイトの一部として利用しにくいため、敬遠されているのではないかと思われる。


リライト被害に合いにくくなる方まとめ

  • 動画やスマホアプリで情報公開
  • お金にならない分野の情報公開
  • 重要な部分を画像化する
    (引用されにくくするため、画像にはロゴやURLなどの『 透かし 』や『 マーク 』 を配置する)

次ページ

画像や写真の無断コピーと無断引用を防止する方法

前ページ

【ページ名】 HTML5対応後の検索結果の変化 【検索結果】

広告