・この記事の概要
KNIME(ナイム)でGoogle Analytics(グーグルアナリティクス)のデータを
扱う方法について解説しています。
GoogleアナリティクスのPV数やセッション数を含む沢山のデータを一気にKNIME上に
取り込むことができます。
KNIMEで取り込んだデータはエクセルやCSVにも使用可能です。
そのほかの代表的なノードの一覧はこちら。
まえがき
目次[非表示]
どうもシャイン社員です。
皆様GWはいかがお過ごしでしたでしょうか?
今年のGW例によって腕骨折により遠出せずに自宅周辺をうろうろしていました(笑)
今回はGoogleアナリティクスをKNIME上で扱う方法についてまとめてみました。
KNIMEは何?っという方は下記の記事をご参照ください。
本ページはKnimeの使い方やできること、などについて説明しています。Knimeはエクセルと同じように表計算ができる無償ソフトウェア
エクセルと違ってVBA記述など不要でマクロをどうさせることが来ます。
ワークフローと呼ばれるカラフルな四角いマークと矢印をつなぐことで動かす
Googleアナリティクスとは
グーグルアナリティクス(Google Analytics)は
「ホームページへの訪問者数」や「サイト内でのユーザー行動」が分析できるツールです。
・何人のアクセスがあったのか?
・どれくらいの時間サイトに滞在していたのか?
・どんなキーワード・経路で検索して訪れたのか?
GoogleアナリティクスはWebサイトのユーザー行動を「見える化」してくれる無料ツールであり
あらゆるサイトの管理するために役に立つ分析ツールの事です。
ご存じない方は詳細は下記の記事が参考になると思います。
GoogleアナリティクスはWebサイトのユーザー行動を「見える化」してくれる無料ツールであり、Webサイトに必要不可欠。そこで本記事では、Webサイトの改善に役立つGoogleアナリティクスの設定方法から基本的な使い方・設定を解説します。
そのGoogleアナリティクスのデータをKNIME上で扱うことができます。
これがどういう事が出来るかっていうと
サイト訪問者数やページビュー数、平均滞在時間を表データで出力することができます。
そのままKNIME上でデータを扱うも良し
エクセルなどに出力することも出来ちゃいます!
先ほど述べたようにGoogleアナリティクスはサイト運営者にとって非常に有効なツールです。
ワタクシも含めブログ運営者の方のほぼすべてがこのツールを使っていると思います。
Web上のGoogleアナリティクスでマウスをポチポチしてアクセス解析をしてもいいのですが
KNIME上でアナリティクスのデータにアクセスしてデータを取得し瞬時にグラフ化、
先月比較や前年度比較などを表やグラフで行う方が効率化できると思います。
本記事ではそのやり方を解説していきます。
それでは見ていきましょう。
KNIME Google Connectorsをインストールする
Google関係のKNIMEノードはKNIME標準搭載ノードではありませんので
KNIME上で新たにインストールする必要があります。
KNIMEを起動し「File」→「Install KNIME Extensions...」の順にクリックします。
ワークフローの作成。ノードの配置方法
KNIME Google Connectorsをインストール完了しKNIMEを再起動したら
ワークフローを作成します。
Node Repository画面に「Google」と入力します。
するとGoogle Connectorノードが一覧で出てきます。
アナリティクスのほかにGoogleドライブにアクセスしたり
Googleスプレッドシートにアクセス出来たり
様々な動作をKNIMEから制御するノードがそろっております。
「Google Authentication」
「Google Analytics Connection」
「Google Analytics Query」
の三つのノードをワークフロー上に配置し下記の様に接続します。
の三つのノードをワークフロー上に配置し下記の様に接続します。
お好みで後段にグラフやFilterなどのノードを追加して自分好みにカスタマイズできます。
Google Authenticationノードでサインインする
まずはGoogle Authenticationノードの解説です。
このノードにてKNIMEからGoogleアカウントへの認証を行います。
右クリックをしてConfigureを選択します。
すると下記のような画面となります。
Configure画面の解説
Congifureの画面を解説していきます。
まず最初に「Scopes」の部分にある
「Google Analytics Connection (Read)」にチェックを入れます。
他の選択肢についてはチェックを入れていても、入れなくてもどちらでも構いません。
下記のように設定します。
私の場合は不要なチェックは外しました。
続いてGoogleアカウントへの認証です。
デフォルトの状態だとStatus :Unknownとなっているかと思います。
左のGoogleマークの「Sign in with Google」をクリックしてください。
するとブラウザソフトが起動し、Googleへのログイン画面が立ち上がりますので
Googleアナリティクスを使用するアカウントを選択し、ログインします。
ログインするとKNIMEがGoogleアカウントにアクセスをリクエストしてきますので
許可をクリックします。
と表示され、Configureの画面では
Status :Authenticatedとなり、認証が完了したことになります。
ここまでできましたら「OK」をクリックして設定完了です。
Google Analytics Connectionの設定方法
続いてGoogle Analytics Connectionの設定方法についてです。
一度Google Authenticationノードを実行(Execute)して実行完了にします。
Googleへのアクセス認証がうまく行くと自動的にConfigureの項目が記入されますので
特に何もしなくてOKです。
強いて言うとプロファイルIDを確認しておくと安心です。
Google Analytics Queryノードの解説
続いてGoogle Analytics Queryノードの解説をしていきます。
こちらのノードで実際にGoogleアナリティクスからアクセスデータを引っ張ってきます。
詳細な設定を行うために右クリックからConfigureをクリックします。
下記のような画面になります。
まず上半分の設定項目について説明します。
まずデフォルトで書いてある
「All」という箇所をクリックして抽出したいデータのカテゴリを選択できます。
- Users(user):ユーザー数などユーザーに関わるカテゴリ
- Time:日付や月、週、年など時間に関わるカテゴリ
- Session:セッション数などセッションに関わるカテゴリ
- Pages Tracking:ページビューなどページに関わるカテゴリ
カテゴリから「Time」を選択し、データ項目は「Date(date)」を選択
「Add」をクリックします。
Dimentionsに「date」が追加されたと思います。
これで日にちごとのデータが出力されます。
同様にカテゴリから「User」を選択し、データ項目は「Users(users)」を選択
「Add」をクリックします。
下記のような画面になったらOKです。
データ取得期間の設定Start date / End date について
取得するデータの期間を設定します。
Start dateからEnd dateまでのデータのみを抽出します。
よく使うデータ項目の解説
グーグルアナリティクスでよく使うデータ項目を下記に列挙します。
これらの項目をセットすることでGoogleアナリティクスのウェブページに乗っている情報と
同じ情報を取りに行くことができると思います。
■User
users:ユーザー数
NewUsers:新規ユーザー数
Number of Sessions per User(sessionsPerUser):
■Page Tracking
Page (pagePath):ページパス
pageviews:PV数
Pages / Sessison (pageviewsPerSession):ページ/セッション
■Session
sessions:セッション数
Avg.Session Duration (avgSessionDuration) :平均セッション時間
■Time
Date(date):日付ごと
Year(year):年ごと
Month of the year (month):月ごと
Week of the Year (week):週ごと
Month Index(nthMonth):Start date月を0としてEnd dateをN番目と表示
■どの項目に含まれているか不明だったのでALLから選択
Bounce rate:直帰率
そのほかの設定
Segmentの項目から「Use predefined segmet」を選択することで
さらに抽出するデータを絞ることができますが混乱しやすいので
基本的に全出力設定する
「Use dynamix segment」を選択しテキストボックスは空欄にしておくことをお勧めします。
FilterやSort、Start indexなどで細かく出力データを設定することも出来ますが
細かい設定が必要なければ特に空白のままでOKです。
ノードの出力結果
ノードの結果は下記になります。
期間を1週間でなく1ヵ月や100日などに増やすことも可能で
このままExcel Writerなどのノードを使えばエクセルに出力可能です!
せっかくなので1日当たりユーザー訪問数を線グラフにしてみました。
「String to Date &Time」ノードで文字列を日付に変換し
「Line Plot」ノードで線グラフを描画します。
自作のGoogleアナリティクスワークフロー
このブログのGoogleアナリティクスのデータを表データ化して
グラフ化したワークフローを作成しました。
こちらにワークフローを置きますのでもしご興味ある方は使ってみて下さい。
それぞれ下記のようなデータたを抽出してグラフを作成しました。
- ページごとのPVを集計し上位10位を抜き出し、グラフ化
ページ名称が途切れてしまっていますが上位10位のみ抜き出しています。
- 3か月分の日数別ユーザー数、新規ユーザー数、PV数、セッション数を同一グラフ化
3ヵ月分のデータを日ごとにつけております。
- 月ごとのユーザー数、新規ユーザー数、PV数、セッション数を同一グラフ化
こうやって表示することで月ごとにどのように数字が推移しているか分かりますね!
- 週ごとのセッション/ユーザー数と、ページ/セッション数を同一グラフ化
セッション/ユーザー数と、ページ/セッション数を表しています。
横軸の0000から始まる数字が週で0週目を表しています。
0010は10週目を表しています。
これはあんまり使わない…かな?
ワークフローの全容としてはこんな感じです。
参考とさせていただいたサイト
本記事を書くにあたり下記のサイトを参考にさせていただきました。
あとがき
いかがでしたでしょうか?
Googleアナリティクスについてはいくつか書籍も出ており、より詳しく学ぶ事が出来ます。
下記のような書籍で勉強してみるもの良いかもしれませんね!
それでは!
0 件のコメント:
コメントを投稿
ここにコメントを書いてね!