Tuesday, 6 January, 2009

未来のスプログ

9月 30日 at 5:00 pm by ジョナサン ベイリー -

The Next Web(ザ・ネクスト・ウェブ)のスティーブン・キャロル氏は、
Datapresser(データプレッサー)と呼ばれるコンテンツ生成サービスを利用していることを認めた。これはTechCrunch(テッククランチ)のあるライターが、このツールを利用している情報を掴んだ後の告白であり、同氏は、著名なブログの配信作業が、今後、このような方式を採用するようになると考えているようだ。

勿論、中には、締切を守るため、コンテンツ生成ツールを使っているメジャーなブログもあるだろう。しかし、コンテンツ生成ツールを愛用しているのは彼らだけではない。スパマーも愛用しているのだ。

スパマー達は何もないとこらからコンテンツを作成するツールを探している。従来、彼らのスパムブログをコンテンツで埋め尽くすために、スパマー達は、記事のデータベース、ブログ(通常は断りなしに)、または、その他の情報源からコンテンツを盗んでいる。この方法では、検索エンジンがスパムを把握しやすく、また、コンテンツを勝手に利用された多くのブロガー達から怒りを買ってしまう可能性が高い。

しかし、テクノロジーは日々進化しており、コンテンツ生成は徐々に実用的になりつつある。多くのスパマー達は、すでにコンテンツ生成を用いる戦略に移行しており、この流れは加速していくだろう。この傾向は、スパム、そして、ウェブの未来にとって重要な意味を持っている。

コンテンツの生成が優れている理由

スパマー達は、コンテンツを手にいれなければならない。その方法は人によって異なる。その中でも特に人気があるのが、コンテンツをスクレイプ(盗用)する手法だが、この手法は様々な欠点を抱えている。

  1. 予測不可能: RSSフィードをスクレイプする場合、コンテンツの質、長さ、ターゲットにしているキーワードが含まれているか否か、届く時期、そして、本当に届くかどうかさえ、本人は把握することが出来ない。一方、コンテンツの生成を実施すると、これらの要素をコントロールすることが出来る。
  2. 著作権の問題: パブリックドメインのマテリアルや適切にライセンスが付与されているマテリアル以外をスクレイプしてしまうと、重大な著作権問題を抱えてしまう可能性がある。オリジナルのコンテンツを作成することで、この問題を回避することが出来る。
  3. コンテンツの重複問題: スクレイプしたコンテンツは、当然ながら、ウェブに既に存在している。要するに、検索エンジンは、コピーされたコンテンツをほとんど信頼しないことになる。

通常、スパマー達は、量を増加させることで、上述の問題を解決している。彼らは、大量のスパムブログを立ち上げ、その幾つかが、検索エンジンのレーダーを逃れてくれることを願い、その確率に依存しているのだ。

最新のテクノロジーの活用することで、この確率を上げることが出来るものの、やはり効率はとても悪い。検知を逃れ、検索エンジンを打破するため、スパマー達は、プロセスを自動化しつつ、スクレイプを改善する方法を探し求めてきた。

最初に編み出されたのが“スピニング”だ。これは、既存するスクレイプした記事が、シソーラスに通され、言葉がランダムな類語に置き換えられていくプロセスである。この手法を用いると、記事が支離滅裂になったり、文字化けしたりするため、読みづらくなってしまう。また、作品のストラクチャーは変わらないため、検索エンジンにもすぐに見つかってしまう。

次に考えられたのが、ゴーストライティングだ。これは、ジェネレイターが、多数のソースから短い文章を盗み、1本の記事に混合するプロセスである。こうすることで、大半の著作権問題を回避することが出来るものの、通常、記事は意味不明になってしまい、さらに、検索エンジンにコンテンツの大半を特定されてしまう欠点がある。つまり、人間も検索エンジンも騙すことが出来ないのだ。

最終的には、外部のソースに依存するのをやめ、ゼロからコンテンツを生成する手法が必要になる。しかし、このようなツールは劣悪であった。ワンパターンの質の低い記事を生成してしまうため、簡単に検索エンジンに見つかってしまうのだ。

しかし、これらのツールはここ数年で徐々に改善されており、スピードを上げる手法と組み合わせることで、優れた記事を作成することが出来るようになりつつある。まだ人間の手に依存しなければならない点が数多く残るものの、人間がゼロから記事を作成し、編集し、投稿するよりも早く、これらの作業を実行することが出来ることに変わりはない。

スパマー達が何もないところから、このような記事を作成するようになるのは、時間の問題であろう。実際に、既に実行しているスパマーがいても不思議ではない。

結果

生成型ブログスパムへのシフトチェンジは、既に行われている。スクレイプされるコンテンツの量は減少するかもしれないが、その他の多くの問題を抱えることになるだろう。

  1. 止めるのが難しい: スクレイプされたコンテンツの場合は、著作権侵害の通知を送付することで、大抵、削除させることが出来る。生成されたコンテンツへの対策は、アンチスパム・ポリシーに大きく左右されるだろう。残念ながら、現段階では、これらのポリシーは不十分だと言わざるを得ない。
  2. 検索エンジンの検知が難しい: 検索エンジンは、重複するコンテンツの検知でさえ四苦八苦している。さらに問題が増えることになるのだ。ブロガー達との競争は激化するだろう。
  3. 人間に検知されやすい: スクレイプに特化するスパムサイトは、その質を巧みに隠しており、人間の読者を見事にだましてきた。生成されたコンテンツは、編集せずに投稿されるため、質が低く、サイトのその他の部分が本物っぽくても、人間には簡単にバレてしまう。

要するに、グーグルがこれらの作品をなかなかフィルタリングすることが出来ないため(私達人間には簡単に見分けがつくものの)、結果ページが、劣悪な記事で埋め尽くされるようになるのだ。そのため、検索エンジンの結果ページで上位に表示するための努力、そして、必要な情報を探す能力に、大きなインパクトを与えるだろう。

しかし、コンテンツ生成ツールがスパムに与える影響よりも、正当なブログに与える影響の方法が遥かに大きいだろう。

両者の区別が曖昧になる

コンテンツの生成が、どのようにスパマーを助けるのかと言う疑問よりも、通常のブロガー達にどのように利用されていくのかと言う疑問をまずは問うべきである。上述の記事のように、ザ・ネクスト・ウェブは、コンテンツの作成をサポートするため、生成ツールを利用しており、他のサイトも利用していると主張している。

彼らの主張がたとえ誤りであっても、良質な記事ジェネレイターは、誰よりも早く記事を綴り、編集し、投稿することが出来る能力を持っている事実を否定することは出来ない。この手法は賛否両論である。たとえスパムには見えなくても、スパムツールを記事の作成プロセスに利用する行為には、否定的な見方をする人が多い。

そこで複数の疑問が浮上する。これらの類のツールを正当なサイトで利用することは出来るのだろうか?どの程度なら、自分の作品を作るために、コンテンツ生成ツールに頼ってもいいのだろうか?メジャーなブログでこれらのツールを利用するとしたら、どのような用途で利用されているのだろうか?

単純な答えはなく、時と場合によって答えは異なるだろう。いずれにせよ、自動化することや人間が作成することが問題なのではなく、そのコンテンツがどのような目的を持っているのか、そして、そのコンテンツがインターネット上で歓迎されるかどうかが重要なのだ。

両者の境界線は既に曖昧になっており、スパムではないブロガー達にコンテンツ生成ツールが浸透するにつれ、さらにこの傾向は強まるだろう。

結論

コンテンツ生成ツールがどのように使用されようと、正当なブロガーだけが手に入れることが出来るメリットが1つだけある。それは、価値を加えることだ。

機械でも優れた記事を作成することが出来るかもしれないが、知恵、意見、経験、そして、目新しさを加えることが出来るのは人間だけである。このような価値がなければ、この戦略は失敗に終わるだろう。

ウェブは質よりも量を重視する傾向があるが、優れたコンテンツが成功する可能性は残されている。投稿するエントリの数も大切だが、投稿サイクルがそれほど活発ではないサイトが実証しているように、何を提示するかの方がよっぽど重要である。

もし、メジャーなブログがこれらのツールを積極的に採用するようになったとしても、人間が何を加えるかが注目されるため、慎重に利用しなければならないだろう。

ブロゴスフィアは反響室のようだと感じている人もいるが、機械に実権を握られてしまうと、この流れに歯止めをかけることは出来なくなってしまうだろう。現在、私達ブロガーは、自分独自のスタイル、意見、そして、アイデアを持っている。しかし、私達が同じゴーストライター・ツールを使い始めると、もはや、このオリジナル性を維持することが出来なくなるはずだ。

個人的には、古き良き方法でこれからもコンテンツを作成していくつもりである。急にスターの座を射止めることは出来ないかもしれないが、ウェブへの貢献という面で、気持ちよく作業に臨むことは出来るはずだ。

ライター紹介: ジョナサン・ベイリーは盗用、コンテンツ盗作、そしてウェブの著作権問題をテーマに取り上げ、Plagiarism Today(プレジャリズム・トゥデイ)でブログを書いている。ジョナサンはコンテンツ盗作問題に対応するウェブマスターが正確な情報を集め、この変化の激しい分野で取り残されないようにこのブログを2005年に始めた。それ以来、コンサルティングサービスをウェブマスターや企業に提供し、彼らが現実的なコンテンツ保護戦略を考案できるように、そして効果的な著作権ポリシーを策定できるように支援している。ジョナサンは弁護士ではなく、彼が提供している情報も法的なアドバイスとして捉えるべきではない。

[原文へ]


トラックバックURL:
http://jp.blogherald.com/2008/09/30/the-future-of-blog-spam/trackback/

1件のコメントがあります。



1コメント

コンテンツジェネレイターの話題…

スプログの話題があったので反応。未来のスプログ(ブログヘラルド、 9月 30日 at 5:00 pm by ジョナサン ベイリー)一部ブロガーも、スプロガー同様のコンテ (more…)