スクレイプ(フィードの盗用)は、ブロガーが対応しなければいけない問題の中でも、最も不愉快な部類の問題に入る。検索エンジンのランキングに悪影響を与え、読者に混乱をもらたし、読者を無意識のうちにスパマーに貢献させてしまうのだ。
スクレイプの被害に遭って喜ぶ人はいないが、それでも、無傷に近い状態で生き残ることができるサイトもあれば、検索エンジンからはじき出され、コンテンツを奪うスパマーに一瞬のうちに定位置を奪われてしまうサイトもあるようだ。
それでは、スクレイパーがもたらすダメージを確実に最小限に留めるには、どうすればいいのだろうか?残念ながら、秘密の公式は存在しない。しかし、とても有効な方法が幾つかあるので紹介しよう。
成長して、抵抗力をアップする
サイトが年齢を重ねるにつれ、検索エンジンにおいても、ユーザーにおいても、スパマーに対する抵抗力は高まる。誰もがゼロから始める必要があり、不安的な期間を過ごすことになるが、抵抗力を育むためにも、深く考えずにブランドの路線を変更したり、新しいドメインに移行するべきではない。
被リンクを構築する
リンクの構築はSEO的な面でも既に立証されているが、スパマー対策においても非常に重要である。スパマーは、自分のリンク構築シシテムをネットワーク内に組み込んでいることが多く、ブロガーのエントリに手をつける前に既に多数の被リンクを手に入れている可能性が高い。そのため、ブロガーが、自分の被リンクを構築することで、そう簡単にスパマーにポジションを奪われることはなくなる。
しかし、被リンクに関して、ブロガー自身がスパマーのように振舞ってしまうことはよくない。単にリンクの交換やリンクの購入に精を出せば言いわけではない。検索エンジンは、このような行為を検知することがあり、罰を受ける可能性もある。こうなってしまうと逆に不利な立場に置かれてしまうのだ。
記事同士でリンクを張る
作成した記事が、以前投稿したトピックに関連しているなら、リンクを張ろう。あくまでも自然にリンクを張る必要があるが、少なくとも1本のエントリから2、3本の記事にリンクを張れるように心掛けよう。スパマーがフィードをスクレイプする際に、HTMLを取り払わなければ、彼らもまたこれらのリンクを掲載し、ブロガーのサイトに帰り道を用意してくれることになるのだ。
検索エンジンは、これらの類の手がかりを採用し、どのURLがオリジナルのサイトなのかを特定している。
RSSにフッターまたはヘッダーを加える
RSSフィードにフッターやヘッダーを加えるだけでは、とりわけスパマー達がコンテンツの特定の場所を狙っていることを考えると、問題を完全に解決することはできない。しかし、RSSをすべて盗まれてしまう際のインパクトを抑制し、全文フィードを守るという面ではとても役に立つ。
もし、WordPress(ワードプレス)を利用しているなら、RSS Footer(フッター)、または、FeedEntryHeader(フィードエントリヘッダー)のいずれかのプラグインを利用することを薦める。FeedBurner(フィードバーナー)を利用しているなら、FeedFlare(フィードフレア)を使えば、ほぼ同じような効果を期待することができる。
自分のサイトを主張する
グーグルも、そして、Technorati(テクノラティ)も、ブロガーが、自分のブログを主張することができるようなシステムを採用している。グーグルに関しては、ブロガーはGoogle Webmaster Tools(グーグル・ウェブマスター・ツールズ)を訪れ、テクノラティに関しては、 プロフィールを作成することを奨める。たとえ自分のサイトに大きな影響を与えることはできなくても、検索エンジンに対して、自分のサイトが人間によって運営されているという明確なメッセージを送ることができるのだ。また、テクノラティでは、ブログの隣にアイコンを掲載することができるので、ユーザーもスパムと区別することができるようになる。
さらに、サイトをMyBlogLog(マイブログログ)や同様のサービスに登録することも奨める。たとえこれらのコミュニティに参加するつもりはなくても、自分のブログの信頼性を立証してくれるサイトを増やすためにも登録しておこう。
スパムをレポートする
著作権の問題を取り上げ、スパムブログを閉鎖に追い込めとまでは言わないが、少なくとも、自分のコンテンツを悪用しているスパマーをグーグルに報告しよう。その際は、必ずグーグル・ウェブマスター・ツールズのフォームを利用しよう。マット・カッツ曰く、このフォームを介したレポートに対しては、グーグルは普通のレポートよりも重要視しているそうだ。
たとえグーグルが検索エンジンからスパマーのサイトを削除することはなくても、問題が認識され、ランク付けに反映されるようになるだろう。
フィード以外の場所でコンテンツを提供する
良質且つ有効なコンテンツをフィード以外の場所、主に静的なページで提供しよう。グーグルは、このようなタイプのコンテンツも好む傾向があり、また、スクレイパーに奪われる危険性もない。たとえスクレイプの被害に遭っていても、ユニークなコンテンツがサイトに多く掲載されていれば、必然的に、グーグルやその他の検索エンジンは、オリジナルのサイトを優先してくれるはずだ。
結論
出来ればスクレイプの被害には遭いたくない。スクレイパーを活用する手法について語る人もいるが、フールプルーフとはかけ離れており、失敗に終わることが多い。しかし、ダメージを緩和する際には役に立つ可能性もあり、ブロガーなら挑戦する価値はあるかもしれない。
そうは言っても、ハイレベルなアクションを要する可能性が高く、必然的に、運よく、あるいはスキルを活用し、スクレイパーにお株を奪われる可能性がある。そうなったときのために、自分を守る法律や手法を知っておくべきである。
しかし、このような状況をできるだけ回避したいなら、事前にこのような攻撃に対する防御を固めておくことを奨める。
ちょっとした対策を講じるだけで、スパマーを遠ざけることができるのだ…
ライター紹介: ジョナサン・ベイリーは盗用、コンテンツ盗作、そしてウェブの著作権問題をテーマに取り上げ、Plagiarism Today(プレジャリズム・トゥデイ)でブログを書いている。ジョナサンはコンテンツ盗作問題に対応するウェブマスターが正確な情報を集め、この変化の激しい分野で取り残されないようにこのブログを2005年に始めた。それ以来、コンサルティングサービスをウェブマスターや企業に提供し、彼らが現実的なコンテンツ保護戦略を考案できるように、そして効果的な著作権ポリシーを策定できるように支援している。ジョナサンは弁護士ではなく、彼が提供している情報も法的なアドバイスとして捉えるべきではない。
[原文へ]
トラックバックURL:
http://jp.blogherald.com/2008/04/01/how-to-help-immunize-your-site-against-scraping/trackback/
コメントはありません