Googleアナリティクスでリファラースパムを除外する方法

googleanalyticsでリファラースパム除外

この記事は2016年1月25日に更新しました。
情報が古くなっている可能性があるのでご注意ください。

この記事の読了時間は約7分です。

Googleアナリティクスはブログの訪問者分析におすすめ!

というわけで、当サイトも導入。

しかし、トラフィックを見るとURLの語尾が.xyzで終わる怪しいサイトが。

しかも複数。

Googleアナリティクスでこれらのサイトを除外する方法を調べました。

スポンサーリンク

Googleアナリティクスの導入

wordpressテーマのsimplicityでの導入手順は以下を参照してください。

参考「アクセス解析」カスタマイズについての解説

手順は

  1. Googleアナリティクス登録
  2. simplicityにトラッキングコードコピペ

リファラスパムとは

スパムサイトからある特定のサイト(被スパムサイト)へ複数回故意的なアクセスが行われるスパムを指します。

リファラースパムとは

アクセス数の流入を偽り、**というサイトから人が来てますよ~と錯覚させる。

サイトの管理者は「お?このサイト何だろう?紹介してくれてるのかな??」

と興味本位で**というサイトにアクセスをしてしまい被害を受ける。

その目的は様々で軽度の被害で済むものもあるが、悪質なものもあるので、

アクセスはしないことが大原則。

リファラースパムの目的

  • アクセス数の水増し
  • 商品を買ってもらう
  • 悪質サイトへリダイレクトさせる
  • ウィルス感染させる
  • フィッシング詐欺サイト

リファラースパムの確認方法

「リファラースパムのURL スパム」で検索

他サイトのリファラースパム記事で、ブラックリスト一覧が公開されている場合があるので、それらの情報に自分が疑わしいと思っているサイトが含まれていないか確認する。

「aguse.jp」で悪質サイトかチェックする。

aguseというのはそのサイトのURLを入力すると、

ブラックリスト判定結果、同一サーバ上の他のウェブサイトなどの情報を解析してくれる。

アクセスは危ない、でも、サイトの様子を知りたいときに使える。

※ブラックリスト判定結果が安全であってもアクセスはやめたほうがいい!

aguse Gatewayではそのサイトの様子を画像として取得してくれるので、安全に怪しいサイトをかどうか確認することができる。

リファラースパムの特徴

ドメインがへんてこ

.xyzとか臭すぎます。

平均セッション時間が0秒

平均セッション時間=ユーザーの平均滞在時間

それが0秒ってことは、そのサイトから来た人は0秒で出て行っていることになるので、結局、来ていない=来ているように偽っている と考えられます。

ホスト名が(not set)

(not set)  The most common hostname for spam, this happens when the spammer doesn’t even bother to set a fake hostname.

引用:Keep calm and Stop Google Analytics Spam

リファラースパマーはアクセスを偽る際に、ホスト名がnotsetになってしまうらしいです。

つまり、「ホスト名がnot set」であるサイトを除外設定すれば、大方のスパムサイトを排除できるようになります。

ホスト名がnot setであるサイトを除外

1.アナリティクス設定>全てのウェブサイトのデータ>フィルタ

googleanalyticsフィルタ設定

2.「フィルタを追加」クリック

googleanalyticsフィルタ

3.フィルタの設定を図↓のようにする。

フィルタ設定方法

①新しいフィルタを作成

②フィルタ名「ホスト名 not set 除外」

自分がわかりやすい名前ならなんでもいい。

③フィルタの種類「カスタム」

④フィルタフィールド「ホスト名」

⑤フィルタパターン「not set」

⑥保存をクリック

これで解決と思ったら…

Googleアナリティクスのデータにフィルタ設定が反映されるのは、このフィルタを設定した後のアクセスデータになります。

引用:リファラスパムにうんざり!Googleアナリティクスでフィルタをかけて除外する! 

ブログ開設してGoogleアナリティクスを導入したら、真っ先にこのフィルタ設定をしてないと面倒なことになるんですね。知らなかった。

既に記録されてしまったリファラースパムを除外する方法も後述。

リファラースパムブラックリスト

全然検索エンジンにインデックスされていない時に、

アクセスを偽ったリファラースパムサイトが↓これ。

  • free-traffic.xyz
  • net-profits.xyz
  • traffic2cash.xyz
  • free-social-buttons.xyz
  • share-buttons.xyz

ブロガーの心をもてあそぶ輩は許せん!

困っていること

既に記録に残ってしまっているリファラースパムからのアクセスはどうやって削除するのか。

参照ソースからドメインを除外するで参照トラフィックを追加しても、記録から消えない。

どうにかして消せる方法がないかなぁ。

以下追記

フィルタ設定前のリファラースパムデータを削除

フィルタ設定をする前にアクセスされたリファラスパムのデータを除外する方法は「セグメント」を利用すれば解決します。

フィルタ設定はこれから起こるであろうリファラースパムを遮断する方法で、

セグメント設定は既に侵入されたリファラースパムをザルを使って綺麗に取り除く方法です。

壁をフィルタ設定で強固にして、侵入されてもザルこせば、綺麗な水だけが残るというイメージ。

セグメント設定もフィルタ設定同様に、柔軟に追加、修正が行えるので、侵入があるたびにより良い物へと更新できます。

セグメント設定方法

1.アナリティクス設定>全てのウェブサイトのデータ>セグメント

セグメント設定方法

2.「新しいセグメント」クリック

セグメント設定

3.セグメント設定を図のようにする。

segment設定

①セグメントの名前

「リファラースパム削除」など、わかりやすければ何でもOK

②「条件」をクリック

③デフォルトでは「Flashの属性」となっている。

クリックし、「行動」の下の方に出てくる「ホスト名」を選択する。

※「行動」は2つあるが最初に出てくる「行動」を選択すること。

④(not set)と入力。

手動で入力してもいいが、クリックすると選択候補が出てくる。

※除外したいサイトのホスト名がnot setでない場合は、

トラッフィック>参照元>特定サイトのURL などを指定するとよい。

⑤デフォルトでは「含める」になっているので「除外する」を選ぶ。

⑥「保存」をクリック

4.レポート表示画面でセグメントを表示させる。

下図の赤枠部分をクリック。

セグメント表示設定

どのデータを表示させるか選ぶ画面になるので、さきほど作成したセグメントの名前(①)を選択する。ここでは「リファラースパム削除」で作ったので、それを探す。左下にある「適用」ボタンを押す。

※「すべてのセッション」も表示させるのがおすすめ。

「すべてのセッション」で侵入されたリファラースパムもカウントするレポートをみて、「リファラースパム削除」でリファラースパムを全て取り除いたレポートと比較できる。

セグメントの表示

すると、

セグメント折れ線

こんな感じで、フィルタ設定をすり抜けてきたリファラースパムを含んだデータ(すべてのセッション)と、リファラースパムを除外したデータを確認することができる。リファラースパムを含んだアクセスなんて見たくなければすべてのセッションを非表示にすればいい。

リファラースパムを含んだデータ参照

リファラースパムを含んだデータを参照できるようにしたい場合は2つ方法があって、

  • フィルタを設定せずに、セグメントのみ設定する
  • もう1つは、「すべてのウェブサイトのデータ」のビューは残しておいて、フィルタをかける用にビューを新規作成すること。

リファラースパムを含んだデータなんて僕はあまり知りたくないけど。

リファラースパムの把握もかねて、フィルタ設定はせずに、セグメントのみ設定しました。

まとめ

Googleアナリティクスのフィルタ設定は「~の条件に当てはまる場合は除外してね、これから」という未来への防衛策。

既に侵入を許し、データから除外したいサイトがある場合は、セグメントを利用する。

純粋な訪問者などのデータを確認するには知るべき設定が多すぎる。

Googleアナリティクスを知るには本を1冊買った方が要領よく学べると実感しました。


この記事をブログ等で紹介する際は下のHTMLコードをコピペしてお使い下さい。
泣いて喜びます。

<a href="http://49hack.jp/referrer-spam-googleanalytics/">Googleアナリティクスでリファラースパムを除外する方法</a>

google関連記事広告
スポンサーリンク

コメントをどうぞ

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

CAPTCHA