リファラスパムの仕組みとGoogleアナリティクスのフィルタリング設定方法

「お、darodar.com からたくさんアクセスがあるぞ。昨日公開した記事を誰か紹介してくれたのかな?」

Google Analytics ユーザーを狙ったリファラスパム

最近、アクセス解析の「参照元」に forum.topic○○○.darodar.com というサイト(○○○は数字)が出てきませんでしたか? URL を見るかぎり、どこかのフォーラムっぽいですね。

自分の記事が紹介されてるのかな? とクリックしてみると英語の EC サイトが…。もちろん、どこを探してもそこに自分のブログへのリンクはありません。

これはリファラスパムと呼ばれるもので、主にサイト管理・運営者をターゲットにした悪質なスパムなのです。

リファラスパムの仕組みや、Google アナリティクスでの対策方法を覚えておきましょう。

リファラスパムとは

ブロガーを含むサイト運営者がアクセス解析でよく見る部分のひとつに、どこのサイトから自分のブログにやってきたのかを知る「参照元」があります。

たとえば、はてなブックマークだったら「b.hatena.ne.jp」というドメインが表示されます。人気エントリーに入ると、ここのセッション数が大幅に上がりますよね。

GoogleAnalytics参照元

通常はこのように、リンクをはってくれたサイトからアクセスがあったとき「参照元」にそのサイトが表示されるのですが、実はリンクをはっていないサイトを紛れ込ませることができるのです。

その目的はただひとつ。アクセス解析を見る管理人を誘い込むため。

自分の書いた記事に言及してくれているサイトを見たい、というのは誰しもが思うこと。これを悪用したのが「リファラスパム referrer spam 」というわけです。

forum.topic○○○.darodar.com

このブログでも、数日前から forum.topic35496733.darodar.com という URL からのアクセスが目立つようになりました。

darodar.com

そのサイトにアクセスすると、下のようなサイトに飛ばされます。

Aliexpress

ん? フォーラムなんてどこにもない、ただの EC サイトです。

これはいったいどういう仕組みなのでしょう。もう少し掘り下げて解説します。

darodar.com リファラスパムの仕組みと対処法

spam

Google Analytics のコードが使われている

forum.topic○○○.darodar.com の○に入る数字は、ランダムなように見えて実は法則性があります。

トピックの ID に見えますが、実はターゲットの Google Analytics コードが入っているんです。

ということは、スパマーの狙いは Google Analytics ユーザーと推測されます。おそらくスクリプトを書いて自動的にリファラスパムを行っているんでしょう。

Amazon に飛ばされるケースもある

当該 URL にアクセスすると、リダイレクトで別のサイトに飛ばされます。僕の場合は Aliexpress というサイトでした。

でも、調べてみると別のサイトに飛ばされたケースもあるようです。

How To Block Darodar Referral Spam To Your Website というエントリーによると、同じく darodar.com のリファラスパムで “単なる Amazon のアフィリエイトページにリダイレクトされた” と書かれています。

The referral URL was a simple redirect (A 301 Redirect) to an Amazon affiliate page.

悪質なフィッシングサイトでは直にサイトの URL を使ってリファラスパムを行いますが、今回のケースはアフィリエイトリンクなので、いったん別のサイトに誘導し、そこからリダイレクトという形がとられているようです。

しかし、darodar.com の狙いは小遣い稼ぎのような生易しいものではなく、もっと別のところにあるのかもしれません。

リファラスパムをブロックする方法

上記エントリー内では、.htaccess によるスパムボットの遮断方法が紹介されています。従来のリファラスパムであればこれでほぼ対策できましたが、残念ながら今回この方法は通用しません。

もうひとつ、今回のリファラスパムに関して詳しく解説しているエントリーをご紹介します。

darodar.com referrer spam and What to do?

ここでも .htaccess によるブロック方法が記されていましたが、「まったく役に立たない」とコメントされています。

その理由として、“アクセスログを詳細に確認してもアクセスされた痕跡が見つからなかったから” と述べています。

今までのリファラスパムはスパムボットが自動的にあちこちのサイトを回っていたのですが、今回のケースではそれを確認できない。しかし、Google Analytics はあたかもアクセスがあったかのように認識している、ということです。

It just means that no one ever visited my website from darodar.com Referral but interestingly Google Analytics is still reporting it as legit traffic.

すべては Google Analytics に対して仕掛けられているようで、現時点ではサーバー側からスパムをブロックする有効な対策方法はないようです。

“これは今後なにか大きな仕掛けをするためのテストではないか” とも書かれているのですが、真相はスパマーにしかわかりません。

アフィリエイトリンクというのもフェイクであって、実際にはどの程度反応があるのか、有効性も含めてテストデータを収集しているのかも。

Google Analytics のフィルタリング

今後もスパムが減ることはありません。こちらでどんなに対策を講じても、スパマーは新たな隙をついて攻撃を仕掛けてくるからです。

リファラスパムであれば、まずアクセス解析にフィルタを設定することで弾いてしまうのが得策です。そうすればへたにクリックすることもありませんし、数字にも影響しません。

Google Analytics を使っているのであれば、もっとも簡単な方法として、ビュー設定にある「既知のボットやスパイダーからのヒットをすべて除外します」にチェックをいれる方法があります。

Google Analytics ビュー設定

ただし、今回のように新たなボットが出現した場合は自分でフィルタ設定しなければなりません。

具体的な設定方法はこちらが参考になります

【アクセス解析】リファラスパムについて対策を書いてみました

フィルタ設定は Google がスパムを判定する要素にもなるので、面倒ですがそのつど対応したほうが懸命といえます。

リファラスパムのやり方と注意点

今回のスパムは新しい手法のようですが、従来のリファラスパムは誰でも簡単に行うことができます。

たとえは、こんな PHP を組む方法。

<?php
$url_ref = "http://参照元URL/";
$url = 'http://アクセス先URL';

$option = array(
 'http' => array(
   'method' => 'GET',    
   'header' => "Referer: ".$url_ref."\r\n"
              ."User-Agent: Mozilla/4.0 (compatible; MSIE 6.1; Windows NT 5.1)\r\n"
  ));

$context = stream_context_create($option); 
$str = file_get_contents($url, FALSE, $context);

//取得したHTMLを出力
echo $str;
?>

参考リファラスパム(referrer spam)をPHPで再現する方法

こんな方法は紹介すべきじゃないかもしれませんが、実は知らないうちにリファラスパムに手を染めているかもしれないのです。

たとえば、上のようなコードが使われた「アクセスアップの極秘方法」なんて記事があったらどうですか? 何の知識もなければ、そのまま実行してしまうかもしれません。

また、「禁断のSEOツール」などと称して、実際にはリファラスパムを行うソフトが販売されることもあります。

アメブロ全盛期によく見かけましたが、スパムと知らずに高いお金を払って手に入れている方はけっこういました。今はどうなっているのかわかりませんが…

こんな方法を使ってスパムサイトと認定されると、検索エンジンはすべて圏外に弾き飛ばしてしまうので、くれぐれもご注意ください。

「知らなかった」ではすまされないので、できるだけ知識を身につけておくことが自衛につながります。

まとめ

本日ご紹介した darodar.com のリファラスパムに対して、有効な対策方法はありません。せいぜい、Google Analytics 上でフィルタ設定をするぐらいです。

他のリファラスパムでもそうですが、見慣れないサイトが出てきたら「まず検索」という習慣をつけておきましょう。aguse.jp を使ってサイトを調べるのも有効です。

また、その情報を公開して被害を少しでも食い止める、というのも情報発信者として必要なことかもしれませんね。

有益な対策情報が出てきたら、また追記したいと思います。

それでは、また。

Author

Naifix 編集部
Web コンサルティング業務を中心に、サイト制作・コンテンツ販売・メディア運営代行業務を行っております。当サイト(Naifix)では、おもにブログ初心者向けのノウハウを無料で配信しています。

執筆・監修 Direx Marketing, Inc.