Wednesday, 19 November, 2008

ピングサービスを使ってスパムボットを避ける方法

9月 19日 at 11:30 am by ジョナサン ベイリー -

WordPress(ワードプレス)を含め、多くのブログアプリケーションがデフォルトでブログのアップデート情報を伝えるように設定している。だらだらと長いピングのURLのリストあるいはPingomatic(ピンゴマティック)等のピングサービスを利用し、記事がアップデートされていることを各サービスが知りたがっているいるかどうかを確かめることができるようにしている。

これらのリストは、デフォルトの状態では検索エンジンとRSSリーダーだけでなく、その他のツールおよびアプリケーションにアップデート情報を提供する「セントラル」ピングサービスも対象外にしている。

しかし、前回の投稿でも紹介したように、セントラルサービスを利用するのはスパマーにとっても簡単である。多くのスパムボットがこれらのサービスをチェックし、利用するのに適するコンテンツを探しまわり、その結果スパム行為に出る可能性があるのだ。

幸いにも、私達人間が頼っているメジャーなサービスは、彼らと直接連絡を取る手段を用意しているため、これらのセントラルピングサービスを飛び越えることができるため、少なくとも一部のスパマーを回避することができる。

ソースに直接向かう、新しいピング戦略が必要となる。

一考の価値があるサービス

ピングを送るサービスを選ぶとき、リスク対見返りの比率に注意するべきである。多くのサービスが、正当か不当かに関せず、フィードを求め、アップデートを送っているか否かに関係なく自動的に定期的な感覚でフィードをチェックする。ピングを送るアドバンテージはその即時性であり、アップデートした直後にインデックスしてもらう見込みが高いことにある。

このため、検索エンジン、とりわけブログの検索エンジンはピングの重要な標的となる。また、オーディエンスに最新の記事が配信されているかどうかを確認するために、人気の高いRSSリーダーだけでなく、フィードバーナー等のコンテンツを意図的にプッシュするサービスをピングする行為は理にかなっていると言える。

サービスのサンプルリストはピングのURLを含め以下のような内容を表示する。

Technorati: http://rpc.technorati.com/rpc/ping
Google Blogsearch: http://blogsearch.google.com/ping/RPC2
Icerocket: http://rpc.icerocket.com:10080
My Yahoo: http://api.my.yahoo.com/RPC
Bloglines: http://www.bloglines.com/ping
Newsgator: http://services.newsgator.com/ngws/xmlrpcping.asp
FeedBurner: http://ping.feedburner.com

当然ながら、このリストは各ブログによって異なる。例えば、ポッドキャストはiTunes(iチューンズ)を求め、そして外国語で書かれたブログは発表したい現地の検索エンジンも同様に求めるだろう。さらに、ブログが新しい場合は、少なくとも誰かに取り上げてもらうまで、後にインデックしてもらえるように、思い切って、セントラルサーバーをピングするのだ。

しかしながら、私達が頼りにしている大部分のサービスが、アップデートを直接知らせるルートを持っており、情報を得るために第三者のサイトを頼っていない。ここが重要なポイントだ。

避けるべきサイト

ピングの宛先のほとんどが人間が利用しているウェブサービスではなく、その他のサービスのアップデートを支援するために策定されたリストに向かっている。例えば、Weblogs(ウェブログズ)、Blo.gs、そして多かれ少なかれ、Blogrolling(ブログローリング)にも同じことが言える。

これらのサービス、そしてその他の同様のサービスは、最近アップデートされた、簡単に理解することが可能なブログのリストを提供する。新しい記事を素早く選び、取り込むことができるため、検索エンジンはこれを歓迎しているが、スパマーもまた同様に歓迎している。なぜなら、スパマーのボットは興味がある分野すべての最新の投稿を読み取ることができるからである。

自分達のサイトを掲載してもらいたいサービスのほとんどにおいては、直接アクセスする方が早いため、これらのセントラルサーバーをピングして、他のサイトに選んでもらえるまでわざわざ待つ意味はない。

これらのサイトは様々な方法でスパムの温床になりつつある。スパマーの中には、注目を集めるためにこれらのサービスを使ってスプログをピングするスパマーや、コンテンツを探し出し、すくい取るためいに使っているスパマーもいる。

ブログの悲しい現状がここにある。ピングサービスでアップデートされたアイテムを探していると、オリジナルのコンテンツをいとも簡単に見つけてしまうスパマーの技に驚かずにはいられないだろう。

リストをアップデートする

ピングのリストをアップデートし、アップデートを送る相手を選ぶプロセスはとてもシンプルだ。

もし皆さんがワードプレスを使っているなら、管理者パネルにログインし、「各種設定」を選択し、「投稿設定」のサブタブをクリックしよう。一番下までスクロールダウンすると、一列に一本のペースでURLが並べられたリストが掲載されている、「更新通知サービス」というタイトルがつけられたテキストボックスを見つけることができるはずだ。このボックスに入れたいURL(名前なし)を1列につき1本、コピー&貼り付けし、「設定を更新」をクリックする。ウェブログズやその他のセントラルサービスにピングを送りたくないなら、pingomaticが記載されている列を忘れずに削除しておこう。

Movable Type 4(ムーバブル・タイプ4)では、「Preferences(プリファレンス)」>「Blog Settings(ブログ・セッティング)」に進む。次に「Web Service(ウェブサービス)」に進み、ワードプレスと同じURLを「その他」の欄に入力する。
しかし、デフォルトの状態ではこのサービスは有効になっているため、ウェブログ等を対象から外す必要があるだろう。.

その他のブログアプリケーションを使っているなら、詳細はヘルプファイルで確認しよう。

結論

残念ながら、コンテンツ盗用を遅延させるこのようなピング戦略の効果は現時点では様子見の段階である。スパマーの中にはこれらのサービスを標的にしている人もいるようではあるが、これができるのは相当腕の立つスパマーのみである。

この方法を用いてメリットを得ることができるのは、一時間に何千通もの記事をスキャン解析できるスパマーのみである。しかし、サーバー、ノットネット、PCに関して、CPUのパワーがスパマーにも与えられているとすると、多くのスパマーがこれを利用している可能性が高い。

これらは皆さんが普段対処している三流スクレイパーの手には負えないものの、立派な個人のネットワークを持っているスパムブロガーなら難なくやってのけてしまうだろう。

当然ながら、コンテンツ盗用を軽視しているとしても、ピング戦略を変更するべき理由は他にもある。サービスを直接ピングすると、アップデートが早くなるだけでなく、重複を避けることにもなるのだ。

多くのピング戦略において、アップデートをできるだけ多くのサイトに送るという作業が共通しているが、多くのサービスが同じアップデート情報を複数回受け取ることを忘れてはならない。害があるわけではないが、この問題は簡単に避けることができる。

何かを失うわけではない。ピングのリストの焦点を定め直すだけで、余分な作業を省くことができるのだ。

ライター紹介: ジョナサン・ベイリーは盗用、コンテンツ盗作、そしてウェブの著作権問題をテーマに取り上げ、Plagiarism Today(プレジャリズム・トゥデイ)でブログを書いている。ジョナサンはコンテンツ盗作問題に対応するウェブマスターが正確な情報を集め、この変化の激しい分野で取り残されないようにこのブログを2005年に始めた。それ以来、コンサルティングサービスをウェブマスターや企業に提供し、彼らが現実的なコンテンツ保護戦略を考案できるように、そして効果的な著作権ポリシーを策定できるように支援している。ジョナサンは弁護士ではなく、彼が提供している情報も法的なアドバイスとして捉えるべきではない。

[原文へ]


トラックバックURL:
http://jp.blogherald.com/2007/09/19/how-to-avoid-spambots-by-using-pinging-services/trackback/

0件のコメントがあります。



コメントはありません