WEBの勉強ノート
Loading

Google Analytics の基本的な仕組みと「こんな時はトラッキングできる?」

2010 年 3 月 9 日 火曜日

Google Analytics の基本的な仕組みと、ユーザーがCookie をブロックしていたらトラッキングを行うことができるか、など、Google Analytics でトラッキングができない場合などをまとめてみました。

Google Analytics はビーコン型のアクセス解析ツール

サーバーログ型 : WEBサーバーのアクセスログを解析

ビーコン型 : ユーザーのブラウザから解析用サーバーにデータを送信して解析

トップページ – サイト内のあるページ – トップページ、のように、戻るボタンなどで1回表示したページ戻ってきたとき、ブラウザがデータをキャッシュしているため、通信が発生しない場合があります。サーバーログ型はキャッシュでページが表示された場合、その PV をカウントすることができません。

Google Analytics のようなビーコン型なら、キャッシュで表示されたページでもカウントすることができます。ただし、Javascript が動かない環境や、Javascript が動作する前にユーザーがページを離れてしまうとカウントすることはできません。

Google Analytics の基本的な仕組み

1.ユーザーがWEBサイトにアクセスする

2.ブラウザでGoogle Analytics のJavascriptコードが実行される

3.クッキー読み取り(設置)

4.見えない画像をリクエスト

5.Google Analytics のサーバーでデータが処理される

6.Google Analytics でレポートを表示

WEBサイトの表示後、埋め込まれたGoogle Analytics のコードが実行され、データを収集。見えない画像のリクエストのパラメータとして、Google Analytics のサーバーにデータを送ります。

こんな時はトラッキングできる?

- cookie をブロックしているユーザーはトラッキングできるか

Google Analytics は 1stパーティクッキーを経由して、すべてのデータを送信します。よって、3rd パーティクッキーのみのブロックなら、トラッキング可能。1st パーティクッキーのブロックもされると、トラッキングできなくなる。

- クッキーを削除されたら

トラッキングは可能。クッキーに保存されていた前回の訪問日などが取得できなくなるため、新規ユーザーと認識される。

- ユーザーが Javascript を OFF にしている

トラッキングできない。同様に、Javascript に対応していない携帯ブラウザなども、通常の方法ではトラッキングできない。

- ページ内で Javascript のエラーが起きたら

ページ内で Javascript のエラーが起きると、残りのコードは実行されなくなる。Google Analytics のコードがそのエラーより後であれば、トラッキングできなくなる。

robots.txt で Disallow: ではなく Noindex: を使う意味

2009 年 5 月 27 日 水曜日

サーチエンジンにインデックスさせたくない場合に、robots.txt を使ってインデックスさせないようにすることができます。たとえば、何かの謝罪のページや、会員向けページとか、いろいろ。その robots.txt でインデックスさせない設定の Disallow: と Noindex: が違う意味を持つようです。

robot.txtのNoindexは、クローラをアクセスを妨げるものではありません。
アクセスは拒否せず、インデックスだけを拒否します。
「中身を見るけれども、内緒にしておく」ということです。

アクセスして、リンクがあればリンクをたどりリンク先へPageRankを渡します。
※ただし、リンクにnofollow属性が付いていたり、meta noifollowタグが記述してあれば、リンク先をたどらないので、PageRankは渡されません。

すなわち、meta noindexタグと同じ振る舞いをします。

suzukikenichi.com : robots.txtのNoindex(Disallowではない!)を使ったPageRankスカルプティング

簡単にまとめると

Disallow:

  • クローラのアクセス自体を拒否して、インデックスを防止
  • クローラがアクセスしないので、次のページへページランクを渡せない

Noindex:

  • クローラのアクセスは許すけど、インデックスはさせない
  • インデックスしないけど、クローラはアクセスするのでページランクは渡せる
  • ただし、サポートしているのは Google だけ

Google のウェブマスター/サイト所有者 ヘルプ を見てみると、たしかに、小さく書かれていました。でも、この文章から、上記の動作になることはさっぱりわかりませんでした。。

ページのコンテンツが他のサイトからリンクされていても、Google のウェブ インデックスに一切登録されないようにするには、noindex メタ タグを使用します。Googlebot がページを取得するとき、noindex メタ タグを認識してウェブ インデックスにそのページが表示されないようにします。また、Google のウェブ インデックスでは、robots.txt ファイルに「noindex」を記述して、クロール対象外の URL リンクへの参照を Google ウェブ検索結果の表示から外すこともできます。

http://www.google.com/support/webmasters/bin/answer.py?answer=35303&query=Noindex&topic=&type=

 

古いドメインのほうが有利であるわけではない

2009 年 5 月 10 日 日曜日

以前から、新しいドメインより古くからあるドメインのほうが SEO に有利だといわれてきたように思いますが、そういうわけではないようです。

よくドメインレジストラなどが宣伝文句で、ドメイン登録年数が長いと検索ランキングで有利!といったことを言うのですが、登録年数が3年だろうと5年だろうと関係ありません。

SEM リサーチ : ドメインの年齢はランキングに影響するか? – Google Matt Cutts氏

ということは、エイジングフィルタに引っかかる最初の 3-6 か月程度を過ぎれば、どのドメインも変わりはないということですね。

h2タグの下にh1があっても問題ないか?

2009 年 5 月 10 日 日曜日

h2 の下に h1 を置きたい場合はそんなに経験してないですが、h2 の下に h4 を置きたい、なんていう場合は結構あります。それが SEO にどう影響するかということは前から気になっていました。

h2 の下に h1 があることは問題ないようです。

ウェブの40%に何らかの構文エラーがあるとの統計もあり、Googleはそうした文法間違いを織り込んだ上でクローラでウェブを収集している。したがって、h1タグ(要素)がh2タグ(要素)の下にあっても問題にはならない。

SEMリサーチ「h2タグの下にh1があっても問題ないか?「ない」- Google Matt Cutts氏」

質問に答えている Matt Cuts さんは、Google の WEB スパムチームのヘッド。ブログも運営しています。
http://www.dullest.com/blog/

Google Analytics のデータ保存期間

2009 年 5 月 10 日 日曜日

最近よく使うので、どのくらいの期間、データが残されるのか調べてみました。

現時点では、25か月を超えた過去のデータであっても消えることはないようです。しかし、料金を支払うことによってデータの保存期間を延長するようなサービスも提供されていませんし、Urchinなどの他のサービスで再利用できる形でのデータのエクスポート機能なども提供されていません。

http://web-tan.forum.impressrd.jp/e/2008/08/19/3758

確かにヘルプには保存期間に関する記載はないようです。データのエクスポートは定期的にしたほうがよさそうですね。