いつもの通りGoogleサーチコンソールで表示回数とクリック数を調べていました。2019年1月28日に突然この日だけ表示回数が急に増えています。新規に立ち上げて2カ月目のブログでは異常な増加です。原因を探ることにしました。
どの位増加したのか?
調査は、サイトに流入直前までのデータを「Googleサーチコンソール」で、流入後のサイト内データを「Googleアナリティクス」で確認しました。
Googleサーチコンソールでのデータ
このブログは新規開設2カ月目でドメインも新規であるため、1日の表示回数は平均約50回で推移していました。ところが2019年1月27日に956回と約20倍に急増していました。クリック数は、平常の範囲でした。
国別のデータ
日本700回 米国65回 ウクライナ34回 イギリス・インド18回 カナダ17回 一桁は43か国に及んでいる。
Googleアナリティクスでのデータ
Googleアナリティクスでは、2019年1月28日と1日ずれている。
1月28日のトラフィックチャネルでは「direct」が52回と異常に多くなっています。
国別では、アメリカが60回と異常に多いです。
データからの推察
Googleサーチコンソールだけで確認された「日本からの表示回数700回」とGoogleアナリティクスだけで確認された「アメリカからのzアクセス65回」を分けて分析します。
理由は、Googleサーチコンソールは、サイトに流入直前のデータで、検索結果をクリックしなければサイトに流入していないためです。「玄関先まで来て玄関に入らなかった」ような感じです。
一方Googleアナリティクスは、「玄関から中に入ったお客様がどこの部屋にいったか」というデータなので、Googleアナリティクスで確認されたアメリカの65回とは、別物として分析するためです。
「表示回数700回」日本からのデータ
アクセス元の国は、サーチコンソールでは日本700回となっています。
日本700回表示の内訳
パソコン:545回(クリック6回)
モバイル:152回(クリック2回)
タブレット:3回
ランディングページ
トップページ:0回
記事ページ:1~71回 全ページにランディング
クエリ―:475ワード
アナリティクスでは、日本の700に値するデータが見えません。
「アクセス65回」米国からのデータ
Googleアナリティクスのデータ
トラフィックチャネル:organic.search20 direct52
参照元/メディア:direct/(non)52 Google/organic17
地域>地域:unitedstates 50 直帰率100%,セッション1,セッション時間0
集客>チャネル:ユーザー51 新規ユーサー50 直帰率100% 平均セッション時間0
参照元:無し
ランディングページ:個々の記事全般
ブラウザ:(not set)50
サービスプロバイダ:Google llc
ユーザー:50 新規ユーザー:50 セッション:50 直帰率100% ページセッション1 ページセッション時間0
アナリティクスではアメリカが50で各記事のページにランディングし、そのページだけ滞在時間0で直帰しています。プロバイダはGoogle.llcです。
リファラースパムの疑いが推測されます。
リファラースパムの疑い
Referral(リファラル)」は、他のホームページに設置された リンクから流入があった場合にカウントされます。一般的にはどこかでサイトが紹介され付随してリンクが設置されそこから流入するのが一般的なReferralです。
スパム目的のリファラルは、一般的なリンクとは違います。リファラスパムは、「アクセス解析でリファラル情報を見ていたサイト管理者」をスパムページに誘導するために行われるものと考えられます。
突然に知らないReferralがあれば、管理者はリンク元の URLをクリックして調べる確率は高く、それを狙ったのがリファラスパムです。
リファラースパムの目安
・ホスト名が「(not set)」であること。
・直帰率が高すぎる(100%)、もしくは低すぎる
・1 セッションあたりの PV数が1に近い(サイト内回遊なし)
・滞在時間が0に近い
・海外サイトからの流入である
時にはウィルス感染等あらゆるリスクが想定されます。リファラスパムの疑いがある時はリンクを踏まないのが鉄則です。
しかし、アメリカからのアクセスは「direct/(non)」で、「リファラル」ではありませんが、スパムでしょうか?
Direct trafficにスパムはあるのか?
ダイレクトトラフィックにもスパムが紛れ込んでいる可能性があります。
リファラースパムを確認する場合にリファラートラフィックだけを見がちですが、実はダイレクトトラフィックにもスパムが潜んでいる場合があります。
一般的にダイレクトトラフィックは、参照元を経由せずに流入があった場合に発生します。以下の流入に分類されます。
・ブラウザのブックマークからの流入
・ブラウザでURLを直接入力して流入
・RSS (Feedly, Livedoor Readerなど)から流入
・メール (Gmail, Hotmailなど)から流入
・スマートフォンアプリから流入
このようにダイレクトトラフィックは、参照元を経由しないで流入します。
スパムではホスト名が(not set)なのはなぜか
ウェブサイトへ直接アクセスせず、Google Analyticsのサーバーへ直接ニセの訪問データを送っているためだととの見方があります。ニセの訪問データをGoogle Analyticsサーバーへ送り、あたかもサイトからアクセスがあったように見せかけているというのです。なのでそのデータはホストを通っていないので(not set)になっているのです。
結論
日本からの表示回数700件は、良く分かりません。初めTwitterやSNSからの拡散によるものかと推測しましたが、デバイス・OSに見当たりませんでした。
PCで545回、モバイルで152の表示回数に関しては、表示されただけでクリックされていません。よってGoogleアナリティクスでは流入がないため、データが見当たらなかったと思われます。
表示だけをさせてサイトに入り込まないスパムはあるのでしょうか。
アメリカからのdirectで52回でサイトに流入したのは、directtrafficからの流入にみせかけたスパムの可能性が高いです。リファラースパムの確認に目が行っている間に、directtrafficから流入したスパムです。根拠は、
・ホスト名が「(not set)」であること。
・直帰率が高すぎる、もしくは低すぎる
・1 セッションあたりの PV数が1に近い(ほとんど回遊していない)
・滞在時間が0に近い
・海外サイトからの流入である
そして、ニセの訪問データをGoogle Analyticsサーバーへ送り、あたかもサイトからアクセスがあったように見せかけてホストを通過したいないことからで(not set)になっているためです。
まとめ
これらのスパムは、「なにかデータがおかしいぞ?」とユーザーに目を向けさせて、解析ツールで事実を確認する手順の中で密かに悪意のあるリンクを作りその先にスイッチを紛れ込ませ、ウィルス等の感染をさせるのではないかと推測します。
事実、おかしな流入元がどこからなのか確認するため、そのURLをクリックて感染という事が報告されています。スパムはどんどん進化していると思われすので常に新しい情報を確認するとともに、フィルターを使うなど安全にサイトを運営しましょう。
tabito(旅人)