簡単な設定でGoogle Analytics上のリファラースパムや迷惑アクセスを除外

Google Analyticsでアクセス解析をしていると、異常値が混じっていてデータが不正確なものになってしまったり、グラフが閲覧しづらい状態になってしまうことがあります。

異常値が計測される理由は色々ありますが、海外のスパムっぽいアクセスものあれば、何らかのデータ収集目的で自動化されたアクセスもあるようです。異常値も1回や2回であれば無視する事も出来ますが、最近ではこのような閲覧目的では無いアクセスが無視できない回数計測されるようになってきました。

今回は簡単な方法でこの異常値のみを除外する方法をご紹介します。

条件を指定して除去しますので、一度設定してしまえば、条件に合致するものはそれ以降表示されなくなります。本当に簡単な設定だけなので、試した事が無い方は是非設定してみてください。

極端にアクセスが多い日はサイトの閲覧者では無いアクセスが含まれているケースがあります。例えば上記の場合は、集客→全てのトラフィック→参照元/メディアの(direct)/(none)の項目が不自然に高い値になっています。(ちなみに上記のデータは当サイトのデータではありません。)

該当日を時間別で確認してみると11時の値が不自然に多いことがわかります。言語の項目も英語が一番になっているので明らかに正常な値ではありません。

異常値の正体を探るために、集客→全てのトラフィック→参照元/メディアで(direct)/(none)を選択した後、セカンダリディメンションの中のネットワークドメインを見てみます。ちなみにネットワークドメインは「ユーザーのインターネット サービス プロバイダ(ISP)の完全修飾ドメイン名です。」とヘルプに記載されています。

するとネットワークドメインの項目はamazonaws.comとなっていました。AWS‎(Amazon Web Services)はAmazonが企業や一般ユーザーに提供しているクラウドサーバーですが、恐らくそのユーザーがデータ収集目的か何かで自動化されたスクリプトを走らせているのでしょう。一般閲覧者では無いと判断出来ますので、今回はamazonaws.comからのアクセスをデータから除外したいと思います。

特定のデータを除外するには、Google Analyticsの設定の中の「フィルタ」という機能を使用します。

フィルタを選択するとこれまでに作成したフィルタ一覧が表示されます。今回はまだ既存のフィルタは存在しない状態ですので「フィルタの追加」を選択して新しいフィルタを作成します。

フィルタ名は何でも構いません。後で見た際に内容がわかる名称を付けてください。今回は仮にamazonaws.comとしました。フィルタの種類は「除外」-「IPSドメインからのトラフィック」-「等しい」を選択して特定のIPSドメインからのアクセスを除外するように設定します。今回はamazonaws.comからのアクセスを除外したいので、ISPドメインの項目はamazonaws.comと入力します。スペルミスがあると誤動作の原因になりますので、前述のネットワークドメイン項目からコピー&ペーストした方が間違いが無いかもしれませんね。念のために語尾に余白やスペースなど無駄な物が入らないように気をつけましょう。

フィルタを作成すると一覧に表示されます。注意が必要なのは、フィルタを作成してもアクセスデータに反映されるのに若干時間が掛かるという事です。作成直後は作成したフィルタが一覧に表示されますが、アクセスデータには反映されません。この段階で、間違った値で設定してしまったと早合点して削除しないように気をつけてください。作成したフィルタがどの程度でデータに反映されるのか正確なところはわかりませんが、作成後1時間程度待てば反映されていることが多いようです。

作成したフィルタが反映されました。11時に存在していた異常値が無くなり、折れ線グラフが見やすくなりました。言語の項目も正常な値になっています。

参照元/メディアの項目でも(direct)/(none)が正常な値になっていることがわかりますね。

如何だったでしょうか?本当に簡単なフィルタ設定だけでスパムアクセスや迷惑アクセスといった異常値を除外できることがおわかり頂けたかと思います。

除外という言葉を使いましたが、大元のデータから削除されているわけではなく、Analyticsで状況を閲覧する際にフィルタを設定することで表示されなくなる仕組みですので、気軽に利用できるのでは無いでしょうか。

今回はamazonaws.comのデータを除外しましたが、フィルタ機能を利用することで、ご自身や自社からのアクセスを表示させないようにするといった具合に様々な応用が可能です。上手く活用してみてください。

2018-3-13 自動的にリファラースパムを除外する設定につきましてはこちらの記事をご参照ください。

(SEO)