2018年9月9日コピペリスト更新(auto-seo-service.org、autoseoservice.org、autoseo-service.org追加)
迷惑極まりないリファラスパムを、Googleアナリティクスの集計からフィルタ機能などを使ってがっつり除外する方法をまとめました。
ちなみにリファラスパムとは、アクセス解析ツールの参照元にリンク元としてURLを表示させ、そこからのアクセスを誘発させるための迷惑行為のことを言います。
この迷惑行為によって、サイト管理者は、正確な集計ができなくなったり、(リンクにアクセスする事で)攻撃を受けたりする可能性があります。
私の場合、以下のフィルタを適用させているのですが、それ以降、リファラスパムの数がほぼほぼなくなりました!
ということで、上記フィルタを適用させるための手順と方法を以下にシェアさせてもらいます♪
Google Analyticsでのリファラスパム対策方法×4
リファラスパムをブロックするには、以下3つのフィルタリング対策が非常に有効です。
ただし、すでに集計されているアクセスに関しては削除できず、以下施策を施した後からのリファラスパムがカウントされない、という仕様になります。
[1] Googleが自動でブロックしてくれる方法
効果 = 小
Googleが収集したボット系のスパム&低品質なアクセスを解析結果に含めないようにフィルタリングします。
設定方法
①「アナリティクス設定」をクリック後、
②「ビュー設定」をクリック。
③"既知のボットやスパイダーからのヒットをすべて除外します"にチェックを入れて、
④「保存」をクリック。
[2] 言語偽装をしているアクセスをブロックする方法
効果 = 小~中
本来ならばja(日本語)やen(英語)と表記されるべき部分に、長ったらしいメッセージを偽装してくるリファラスパムがあります。
最近では、Secret.ɢoogle.comやmotherboard.vice.com等が以下のようなメッセージを偽装しています(ユーザー→地域→言語)。
このようなリファラスパムを防ぐ為には以下のような設定をします。(参考サイト=Ohow.co)
①「アナリティクス設定」をクリック後、
②「すべてのフィルタ」をクリック。
③"フィルタ名"に任意の分類用タイトルを入力
④「カスタム」をクリック
⑤「言語設定」を選択
⑥"フィルタパターン"に『\s[^\s]*\s|.{15,}|\.|,』と入力
⑦"使用可能なビュー"からフィルタを通したいビューを選択して「追加」をクリック
⑧「保存」をクリック
[3] 自ドメインをホストとしたアクセス以外をブロックする方法
効果 = 中
コメントいただいたのでこの方法も追記します。
自ドメインをホストとしたアクセス(自分のサイトURL内に貼られたアナリティクスタグで取得されたアクセス)のみを計測するようにするフィルタリングします。
設定方法
①「アナリティクス設定」をクリック後、
②「すべてのフィルタ」をクリック。
③"フィルタ名"に任意の分類用タイトルを入力
④プルダウンから「右のみを含む」を選択
⑤プルダウンから「ホスト名へのトラフィック」を選択
⑥プルダウンから「次を含む」を選択
⑦"ホスト名"に自分のサイトのドメインを入力
⑧"使用可能なビュー"からフィルタを通したいビューを選択して「追加」をクリック
⑨「保存」をクリック
[4] 指定したドメインをブロックする方法
効果 = 大
リファラスパムとおぼしきドメイン(リスト参照)を、1つ1つ手動でフィルタリングしていきます。
設定方法
①「アナリティクス設定」をクリック後、
②「すべてのフィルタ」をクリック。
③"フィルタ名"に任意の分類用タイトルを入力
④「カスタム」をクリック
⑤「参照」を選択
⑥"フィルタパターン"にブロックしたいドメインを255文字以内で入力(ドメイン入力時の注意参照)
⑦"使用可能なビュー"からフィルタを通したいビューを選択して「追加」をクリック
⑧「保存」をクリック
ドメイン入力時の注意
ドメイン名は正規表現を用いて入力しなければいけません。
上の例で言うと、"4webmasters.org"をフィルタリングしたい時は"4webmasters\.org"というふうに".(ドット)"の前に"\(バックスラッシュ)"を入力する必要があります。(参照=正規表現の概要)
また、正規表現をうまく活用すれば、以下のような事もできます。
2つ以上のドメインをフィルタリング
例えば、以下3つの有名なリファラスパムドメインをフィルタリングする場合、
- priceg.com
- semalt.com
- social-buttons.com
"|(パイプ)"で区切って、2つ以上のドメインを1つの正規表現で表す。
priceg\.com|semalt\.com|social-buttons\.com
"()"を活用して、トップレベルドメイン(.com等)で分類する。
(priceg|semalt|social-buttons)\.com
という風に記すことができます。
スポンサーリンク
コピペ用ドメインリスト
集めたリファラスパムドメイン一覧
以下、ロシアや中国等からの被害数が多いであろうリファラスパムドメインを集めてみました。
実際は、私の運営するサイトだけでも、これの10倍近いリファラスパムドメインが集まったのだけど、アフィリエイトやドロップシッピング、各種店舗などのものを入れると汎用性に欠けると思うので省きました。
- 100dollars-seo.com
- 24x7-server-support.site
- 4webmasters.org
- abc.xyz
- abcdefh.xyz
- advokateg.xyz
- alfabot.xyz
- arendovalka.xyz
- addons.mozilla.org
- adf.ly
- adtiger.tk
- aliexpress.com
- autoseo-traffic.com
- auto-seo-service.com
- auto-seo-service.org
- autoseo-service.org
- autoseoservice.org
- egalka.xyz
- best-seo-offer.com
- best-seo-solution.com
- bestwebsitesawards.com
- bezlimitko.xyz
- biteg.xyz
- blackhatworth.com
- blackhatworld.com
- boltalko.xyz
- brateg.xyz
- budilneg.xyz
- buketeg.xyz
- bukleteg.xyz
- buttons-for-website.com
- buttons-for-your-website.com
- buy-cheap-online.info
- darodar.com
- econom.co
- etc.com
- fast-wordpress-start.com
- free-share-buttons.com
- free-video-tool.com
- google-liar.ru
- googlsucks.com
- hulfingtonpost.com
- humanorightswatch.org
- ilovevitaly.co
- ilovevitaly.com
- iskalko.ru
- justprofit.xyz
- keywords-monitoring-success.com
- keywords-monitoring-your-success.com
- lifehacĸer.com
- lumb.co
- masamunelink.com
- motherboard.vice.com
- monetizationking.net
- o-o-6-o-o.com
- pornhub-forum.ga
- priceg.com
- rank-checker.online
- rankings-analytics.com
- ranksonic.org
- reddit.com
- resell-seo-services.com
- responsive-test.net
- savetubevideo.com
- scripted.com
- semalt.com
- semalt.media
- simple-share-buttons.com
- site-auditor.online
- snip.to
- social-buttons.com
- speedup-my.site
- stackexchange.com
- success-seo.com
- thenextweb.com
- top1-seo-service.com
- top10-way.com
- torrent-to-magnet.com
- trafficmonetize.org
- traffic-paradise.org
- theguardlan.com
- uptime.com
- uptime-alpha.net
- video--production.com
- website-analytics.online
- непереводимая.рф
- ḷ.com
正規表現フィルタリング用のスパムドメインリスト
そして、さらにこれらを指定したドメインをブロックする方法のフィルタリングに活用できるように、正規表現でまとめてみました。
ここに、あなたの運営サイトに来るスパムドメインを足していく形で運用していけば、効率が良いかと思われます。
▼.comタイプのスパムドメイン(2018年9月9日)
(aliexpress|bestwebsitesawards|blackhatwor(ld|th)|buttons-for[a-z-]*website|darodar|etc|free-share-buttons|googlsucks|hulfingtonpost|ilovevitaly|masamunelink|o-o-6-o-o|priceg|savetubevideo|semalt|simple-share-buttons|social-buttons|theguardlan)\.com
▼.comタイプのスパムドメイン2(2018年9月9日更新)
(100dollars-seo|best-seo-[a-z]*|fast-wordpress-start|free-video-tool|keywords-monitoring[a-z-]*|lifehacĸer|rankings-analytics|reddit|scripted|success-seo|stackexchange|thenextweb|top10-way|torrent-to-magnet|uptime|video--production)\.com
▼汎用タイプのスパムドメイン(2018年9月9日更新)
[a-z0-9-]*seo.?service[a-z0-9]*\..[A-Za-z0-9\-]{2,30}$
▼.orgタイプのスパムドメイン(2016年7月3日更新)
(4webmasters|addons\.mozilla|humanorightswatch|ranksonic|trafficmonetize|traffic-paradise)\.org
▼その他タイプのスパムドメイン(2017年2月23日更新)
(econom|ilovevitaly|lumb)\.co|pornhub-forum\.ga|buy-cheap-online\.info|adf\.ly|semalt\.media|(responsive-test|monetizationking|uptime-alpha)\.net|(rank-checker|site-auditor|website-analytics)\.online|(google-liar|iskalko)\.ru
▼その他タイプのスパムドメイン2(2017年8月7日更新)
(24x7-server-support|speedup-my)\.site|adtiger\.tk|snip\.to|(abc|abcdefh|advokateg|alfabot|arendovalka|begalka|bezlimitko|biteg|boltalko|brateg|budilneg|buketeg|bukleteg|justprofit)\.xyz|непереводимая\.рф|ḷ.\com
まとめ & プラスアルファの情報
まとめ
ということで、Googleアナリティクスでリファラスパムを防ぐためのフィルタリング方法としては、
Googleが自動でブロックしてくれる方法を導入しつつ、さらに指定したドメインをブロックする方法を正規表現を用いたスパムドメインリストを活用して導入すれば良いでしょう。
ただし、リファラスパムは新たなドメイン・新たなIP・新たな手法であなたのサイトに足あとを残していきます。
上記方法を用いてもすべてをブロックすることはできません。
リファラスパムとおぼしきドメインを見つけたら、手動でリストに加えていきましょう。
プラスアルファの情報(蛇足w)
ちなみに、このリファラスパムを行なうためのツールは、アクセスアップツールとして普通に国内に出回っています。
そして、たちの悪いことに「半自動でアクセスアップ」とか「キーワードから選出したターゲットからのアクセスが得れる」等と、一見してスパム行為とは分からない形で販売されています。
そのため、そうとは知らずツールを購入し、スパム行為を行なっているサイト管理者も多いとか・・・。
実際のところ、まず成約には繋がらず、かつ恨みさえ買ってしまう(ネット上で負のPRに繋がってしまう)可能性があり、また、アナリティクスのフィルタリング情報や、Googleの通報システムなどによって、スパムサイトと認定され、2度と検索エンジン上に表示されないサイトになってしまう可能性さえあります。
1万~2万円も支払って、デメリットだらけのツールが欲しい人はあまりいないと思いますが、双方のためにも、絶対に購入しないようにしましょう。
コメント
リファラスパムは定義済みのホスト名へのトラフィックのみを集計するようにすれば除去できるよ。
情報ありがとうございます♪
そう!一応それも試してはみたんですけど、どうしても漏れが発生してしまうんですよね!
(比較的新し目のロシア系(?)はこの方法でいけるんですけど、semalt.comとかbuttons-for-website.comみたいに、ちょっと古いものや最新のもの、日本系はほぼスルーでした)
今回、「htaccess制御」→「自ホストのみフィルタ」が両方うまくいかず、結局、以前ちょっとだけ手を付けていた、この記事の方法に行き着いた(立ち戻った)次第です(^^A
たぶんこの先も、スパム業者とのイタチごっこは延々と続いていくんでしょうね。。。
ほんとイヤになります(w_-;
バックスラッシュ、と言いつつ、記号はスラッシュになってますよ。。
あ!ほんとですね(^^ゞ
修正しました。
ご指摘ありがとうございます♪
正規表現の『\s[^s]*\s|.{15,}|\.|,』の意味を教えてほしいです。
とくに、[^s] の部分ですが、「小文字のs以外の文字」っていう意味でいいですか?
教えてもらえると助かります!
あ!すみません!入力ミスしてました!
\s[^s]*\s|.{15,}|\.|,
ではなく
\s[^\s]*\s|.{15,}|\.|,
でした!
ご指摘ありがとうございます。修正しましたm(_ _)m
意味は、以下だと思います。
\s[^\s]*\s = 空白を含む
.{15,} = 15文字以上
\. = .を含む
, = ,を含む
http://www.designcross.net/google-analytics/languages.html
を見る限り、.{15,}の部分は.{10,}くらいの方が良いかもですね。
なるほど、理解できました! ありがとう。
ちなみに、言語には (not set) も出てくるから
最低でも9文字は除外したいですね〜。
教えてもらったとおり、ちょっと多めの .{15,} で設定しようと思います。
ご丁寧にご返信ありがとうございます。
確かに、(not set)はリファラスパムじゃない事も普通にあるので、正常な処理に入れるべきですね♪
ちなみにあれから、言語コードで10文字オーバーがないかどうか、自分のGA解析結果5年分程でより詳しく調べてみたところ、「ja-jp_radstr」というのが稀に登場していました。
なので、めいこさんがチョイスした方法である、 .{15,} の設定の方が良さそうです(^^A
こんにちは、はじめまして、兵庫県在住BINGEと申します。
自分は、自分の書いた文章が、何人に読まれたか?というのを、確認するために、
文章に、カウンターをつけているんですが・・・。最近なんですが、サーチエンジン
にもインデックスされていないのに、アクセス数が100とか、何と400とかあり。
自分)→サーチエンジンにも登録されていないのに、アクセス100って、何?
と、奇妙に思い、ネットで、調査してみたんですが?どうやら、ご指摘のとおり、
リファラースパムという、うそカウントみたいです・・・。(もう・・・!)
そこで、google analticsで、反映しないように、設定しました。
まったく、迷惑な話ですね、これ?
カウント100だ!ってよろこんだ自分って・・・。
それでは。