Wednesday, 19 November, 2008

コンテンツ盗作の見つけ方

5月 24日 at 7:01 pm by ジョナサン ベイリー -

コンテンツの盗用が増加し、影響を受けるブロガーの数も増加傾向にある。

多くのブロガー、特にスパムされやすいキーワードを利用しているブロガーは初めの記事からすくい取られてしまう。この悲劇を逃れたブロガーも、残念ながら、サイトがリンクを集め、ブログ検索エンジンとコンテンツに飢えたスパマーの注目を集めだすと、結局すぐに同じ運命を辿ることになる。

結局、これは「もし」ということではなく、「いつ」君の真新しいブログが、自動的なプロセスあるいは自分のサイトのスペースを埋めようとする人間の手によって盗用されるのかということだ。

しかし、このような盗用を発見するのは気が遠くなるような作業だ。ただでさえ巨大なインターネットは今この瞬間も成長を続けており、盗用されたコピーを見つけるのは、やはり至難の業である。

幸運にも、スパマーや盗用者が君の作品から利益を得るために頼っているツールそのものを使うことで、彼らを発見するのが楽になる。そのため、利用できるツールの使い方を知っているかいないかが大きな鍵となる。

テキストの盗用

すべてのメディアフォーマットのなかで、盗用の予防が一番難しいのがテキストである。幾つかジャバスクリプトを使ったトリックが存在するが、簡単に破られてしまう。そしてテキストをイメージの中に隠してしまうという手法もあるが、これを実行すると、検索エンジンからもテキストを隠してしまうのだ。

それでも、テキストの盗用は簡単に見つけることができる。まさに不幸中の幸いだ。一番簡単な方法は自分が綴った記事内の独自の文を探し、その文をメジャーな検索エンジンで検索するだけだ。

例えば、この記事においては、「スパマーや盗用者が君の作品から利益を得るために頼っているツールそのもの」という文(少なくとも現時点までは)がいいだろう。検索を何度も行う手間を省くため、その文に対してGoogle Alert(グーグル・アラート)を設定するのも手だ。そうすることでその文を使ったサイトが出現すればグーグルがメールで教えてくれる。

もう一つワードプレスのブロガーが使える手法がある。Maxpower(マックスパワー)のDigital Fingerprint Plugin(デジタル・フィンガープリント・プラグイン)を使って各記事にカスタマイズした指紋を挿入する手法だ。デフォルトではすべてのフィードのエントリに掲載される設定になっているが、手動でサイト自身に掲載することもできる。このプラグインを使うと、検索するのが簡単であり、グーグル・アラート用に設定する独自の文を作ることができる。

さらに、ウェブサイトのコンテンツ用の自動検索サービスを提供するウェブサイトもある。こういった検索サービスを利用すれば、自分の作品を検索する際に必要とされる作業の多くを軽減することができる。こういったサイトの中でも最も洗練されているのがCopyscape(コピースケープ)である。しかし無料検索1回につき結果が10サイトしか表示されないのが玉の瑕である。PlagiarismChecker.com(プレジャリズムチェッカードットコム)はページ内の独自のフレーズを推測するアルゴリズムを使っており、基本的な盗作チェックサービスを提供している。そしてArticle Checker(アーティクル・チェッカー)はサイトの細かい検索サービスを提供しており、ユーザーが盗用サイトに導いてくれそうな文を拾い上げる際に役立つ。

写真の盗用

テキストの盗用とは異なり、写真の盗用は比較的、盗用の対策が簡単だ。しかし、Flickr(フリッカー)等の写真共有サイトの人気が上がり、写真のアップロードが簡単になるにつれ、写真の盗用も増加傾向にある。

テキストとは異なり、盗用された写真を楽に検索する方法は見当たらない。検索エンジンはテキストのみを感知するので、Google Image Search(グーグルのイメージ検索)等の特化型検索エンジンを使ったとしても、写真を見つけるのは難しい。

1つ目の手法は、イメージに独自の名前をつけ、その名前で検索するというものだ。また、可能なら、サーバーログを見守るのが有効だ。これはなぜかと言うと、盗用者は写真の所有権を主張するだけでなく、その写真をサーバーから自分のサイトに直接読み込むため、写真に注がれる帯域幅と労力も盗んでいるからだ。

また、そっくりのイメージを発見するために開発された新しい実験的な検索エンジンも存在する。同様の取り組みを行う検索エンジンは複数あるものの、ウェブをまとめてインデックスするものは存在せず、また我々が利用できるものも限られてしまう。

イメージ検索エンジンに加え、Digimarc(デジマーク)は、目に見えない透かしをイメージに埋め込むことで、ウェブ上に配信されても検索できるサービス、MyPictureMarc(マイピクチャーマーク)を提供している。しかしながら、このイメージ追跡サービスの利用には1年間500ドル近い料金を支払う必要があり、このサービスを多くのアマチュアの写真家が利用するというのは妄想に近い。

つまり、現時点ではイメージにしっかり印をつけて、簡単に盗まれないようにするのが最も賢い選択と言える。現状では、大部分のイメージ盗用は、技術を通してではなく、忠実な読者の報告により判明することが多い。新しいツールの登場によりこの傾向が変わっていくことは間違いないが、少なくともあと数ヶ月は待たなければならないだろう。

オーディオおよび動画の盗用

現在、オーディオと動画の盗用は、イメージやテキストの盗用と比べると、比較的件数は少ない。オーディオと動画を編集するツールは値がはり、使いこなすのも難しい。また、こういったコンテンツをホストするツールは以前から大部分のウェブマスターが利用できるような代物ではなかったからだ。

しかし、YouTube(ユーチューブ)等の登場で、オーディオや動画の盗用に関する懸念が増加している。しかし、残念ながら、これらの盗用の発見するのが非常に困難な状況に変わりはない。

多くの企業が複製したオーディオや動画コンテンツの特定に取り組んでいるが、彼らが対象としているのはエンドユーザーではなく、大企業である。

例えば、MySpace(マイスペース)との提携で有名になったGracenote(グレースノート)はオーディオに指紋を施すサービスを提供し、Audible Magic(オーディブル・マジック)はオーディオと動画両方に対してツールを提供している。両社のサービスはとても効果的だが、個人ベースではなく、企業ユーザーを対象としている。

しかし、多くのオーディオコンテンツや動画コンテンツの盗用を発見することができる手法がある。情報を容易に検索できるようにするために、クリップをタグづけする必要があるので、自分のコンテンツに関連するタグを追っていくのだ。この類の盗用を発見する方法としては、現状では最も有効だろう。

サーバーログのチェックを除けば、上記の方法が最も効果的だ。しかし、ポッドキャストやビデオブログの人気は引き続き右肩上がりなので、企業がこの市場に足を踏み入れるのは時間の問題であろう。

結論

多くのコンテンツのタイプにおいて、盗用やコンテンツ盗作を発見するのは、かなり単純な問題と言える。誰が君の作品を乱用しているのかを見つけるために利用できるツールがあるので、これらのツールを利用する方法を知っているか否かが運命の分かれ道となるのだ。

盗用に興味がなくても、同様の手法を、自分のコンテンツの合法的な利用を追跡するために活用することもできる。例えば、人々はCreative Commons(クリエイティブ・コモンズ)のライセンスを利用しているので、自分の作品がウェブに広がっていく仕組みを学ぶのも手だ。

しかし基本を忘れてはいけない。ウェブに、とりわけブログに記事を投稿するなら、その記事が使われるのは時間の問題だ。恥ずかしいかもしれないが、これを防ぐには、まず学ぶことだ。そして学ぶためには、どこを見ればいいのか把握しなければいけない。

注意:私は弁護士ではなく、この記事も法的な助言として有効なものは何一つない。この記事の内容は公正使用に対して行った広範な調査に基づいているが、法的な真実として捉えてもらいたくない。公正使用に関して疑問があるなら、弁護士に相談しよう。

_________________________________________________________________
ジョナサン・ベイリーは盗用、コンテンツ盗作、そしてウェブの著作権問題に関するサイト、Plagiarism Today(プレジャリズム・トゥデイ)でブログを書いている

[原文へ]


トラックバックURL:
http://jp.blogherald.com/2007/05/24/how-to-detect-plagiarism-and-content-theft/trackback/

1件のコメントがあります。



1コメント

コンテンツの無断使用を防ぐ…

インターネット上のデジタルコンテンツはコピーが簡単です。ですから、無断使用での著作権侵害が大きな問題となっています。有用なコンテンツであればあるほど、盗用されてしまうの (more…)