2006年07月17日
米Microsoft スパム・ページを認識する「Strider Search Defender」を開発
日経BP「Microsoft,“スパム・ページ”を識別する新技術を開発」より
米Microsoftの研究部門は,広告サイトなどへの誘導目的で設置されるスパム的なWebページ(スパム・ページ)やブログを識別する技術「Strider Search Defender」を開発した。同技術を使えば,Webページの内容を解析することなく,そのページがスパムかどうか判定できるという。
7/14の記事なのですが、ページ内の内容を解析しないで、どのようにしてスパムかどうかを判断するのでしょう?
スパム・ページの運営者は,広告サイトなどへリダイレクトするようなWebページやブログ・ページを大量に用意しておく。
そのうえで,検索エンジン最適化(SEO)の手法を用いて,スパム・ページが検索結果の上位に表示されるようにする。
さらに,一般のブログや掲示板に誘導コメントを投稿する「コメント・スパム」,誘導目的のトラックバックを送る「トラックバック・スパム」といった手口も使う。
スパムページの運営者もいろいろやって大変ですね。
こういった事に時間とエネルギーを使うなら、コンテンツの充実にがんばった方がいいと思うのは僕だけしょうか??
従来の対策では,各Webページの内容を解析してスパム・ページかどうかを判断していたという。それに対しStrider Search Defenderでは,リダイレクトの有無や同様のWebページの数などを判断基準として使う。
う〜ん、この説明では、まだどんな技術をを使うのかは分かりません。。。
具体的には,「Spam Hunter」というツールでコメント/トラックバック・スパムの被害を受けているブログなどからURLを収集し,スパム・ページのURLリストを作る。
続いて,このURLリストのリンクを「URL Tracer」というツールで追跡し,誘導先のサイト(広告サイトなど)を突き止める。
この説明でやっと分かりました!
コメントスパムやトラックバックスパムにあるURLから、スパムページを探し出すということですね。
確かに、海外のサイトのコメントスパムやトラックバックスパムはすごいですからね。
当ブログでは、今のところ海外からのトラックバックスパムはないですが、僕の知り合いのブログでは、大量のコメントスパムにやられていました。
この「Strider Search Defender」という方法でスパムページを見つけることは、理にかなっているかもしれませんね。
