ここでは、市場分析・顧客分析の基本処理を行う、スクリプトを公開しています。基礎となる技術は、我々が提案している「MUSASHIコマンド」をベースにしています。これらの処理の組み合わせで、数百GBの顧客データを実際に処理しています。これらを参考に、あなたも必要なデータを出してみましょう!!(データは、基本的に2012年6-7月のデータを使ってます。)
1.「まだまだ若い君のために!初心者コース」
1-1. 基本中の基本(何事も練習、練習。確実にマスターしよう!)
<内容> (2012年6月のデータを使ってみよう)
- 商品別売上金額ベスト10
- 商品別売上個数ベスト20
- 時間ごとの売上金額一覧(1時間ごとの売上金額の合計を出す。期間は1ヶ月間)
- 時間ごとの売上個数一覧
- 日ごとの売上金額(期間は1ヶ月間)
- 日ごとの売上個数
男女別売上金額男女別売上個数- 購買金額の高い顧客ベスト10
- 購買個数の高い顧客ベスト10
<ポイント>
1)ここでは、まず、分析の基本となる集計コマンド"xtagg"を中心に練習していきます。最後に顧客だけを対象にするために、"xtdelnul"も使ってます。 (ただしTESTデータは会員顧客データなので、必要ありません)2)時間ごとの集計では、xtsubstrを使って、4桁の時間から時だけを抜き出します。
1-2. 基本の確認(基本の確認です、確実に組めましたか?)
<内容>
- 曜日別売上金額
- 日別の一人当たり平均購買金額(ここでは、レシート1枚を一人と見よう。)
<ポイント>
1)曜日別売上金額では、日付をもとにしてxtcalによって曜日を追加します。xtcal -c 'datefmt($日付,"%E")'などで曜日が追加できる。2)平均購買金額を求めるには、まずバスケットごとの合計を求め、そのあと日別の平均を求めます。バスケットはレシート1枚を一人として集計します。そして、平均はxtaggのパラメーターを変えて求めます。詳しくはマニュアルを参照すること。
2.「アナリストへの道は険しいぞ!分析ビギナーコース」
2-1 本当に初心者マークが取れているかな?
<内容>6月 7月
- ・曜日別の一人当たりの平均売上金額を6月分と7月分、2つの帳票を出してください。
曜日:金額 曜日:金額
2-2 分析の基礎となるコマンドの修得(ビギナーの第1歩、基本コマンドを覚えよう)
<内容>曜日:6月平均金額:7月平均金額
- ・上記の帳票を使って、6月と7月の曜日別一人当たりの平均売上金額を比較する帳票。"xtjoin"を使おう!
201206 12 客数
- ・6月、7月の12時台の来店客数。来店客数を求めるには"xtuniqt""xtcount"を使おう。会員一人1日1回以上は来ないものとして、日付でユニークしよう。 ちなみに12時台を選択するには、xtsubstr,xtselstrなどの組み合わせ、xtsel,xtselstrの組み合わせなどが使えます。最後に6月と7月のファイルをxtcatでくっつけましょう。
201207 12 客数日付 :12時金額 : 17時金額
- ・6月の日ごとの12時、17時別売上金額。例えば"xtselstr"と"xtagg"を使うやり方があります。
20120601 :・・・ : ・・・・
20120602 :会員 :販売金額:シェア
- ・1月の会員顧客の平均来店間隔日数。"xtslide""xtcal"など、時間に関係するコマンドを使おう!
- ・1月中の会員顧客の購入金額が全体に占める割合。"xtshare"を使って、シェアを出そう!
非会員:販売金額:シェア2-3ビギナー卒業検定(基本コマンドを使いこなせれば、ビギナーは卒業!)
- ・1-1で求めた商品別売上金額ベスト10の商品を最も多くの金額を買っている顧客ベスト10を求めよう。"xtcommon"など、多くのコマンドの組み合わせが必要。かなり高度になってきてるよ。
3.「市場調査の基礎をマスターだ!セミプロコース」
New!! 下記3の販促分析演習はこのリンクを参考にした方がわかりやすい。3-0 基礎分析をしっかりと
すべての市場調査はしっかりとした基礎分析が必須です。市場の基本的な指標を把握し、現場知識や経験の足りない部分を地道な基礎分析で補っていきましょう。
1)シャンプー&リンス、ヘアケア商品カテゴリの売上推移(1998年の推移を月別で求めます。):分類4(商品カテゴリの中分類を意味する)を使って、対象商品カテゴリのデータを抽出します。シャンプー&リンスの分類4の分類コードが2428、ヘアケア商品の分類コードが2430になります。その際に、データを見れば意味が分かるように分類マスター(/mnt/h01/Master/KO4MF/dat.xt)から分類名をジョイン(xtjoinを用います)しておいてください。
2)上記2カテゴリにおけるブランドシェアを求めてください。:フィールドは「ブランド」を用いてください。ブランド名もマスターを参照して追加しておいてください。ブランドマスターは/mnt/h01/Master/BRAMF/dat.xtになります。今後は自分でファイルを探すこともあります。
3)1998年のこれらのカテゴリ内のメーカーシェアを求めてください。メーカー名もジョインしておいてください。メーカーマスターはMAKMFの中にあります。
4)シャンプー&リンスに絞って商品別売上推移を求めます。:商品名もマスター(SYOMFのディレクトリの中にあります。自分で探してみてください。)をもとにつけてください。
5)ラビナス商品の販売数量推移を求めてください。期間は1998年の1-4月の4ヶ月間。ラビナスのブランドコードは7200106です。日別と週別、月別の売上推移が求められるように。
6)ラビナス商品の価格推移を上記期間で求めなさい。エクセルのピボットを使って効率的に求めましょう。
3-1 関連性を分析しよう!バスケット分析を体験
- 花王の商品「ラビナス(ブランドコード:7200106)」と、同時に購入されている商品の中で、もっとも同時購入確率の高いブランドベスト10を購入確率とともに求めなさい。ただし、同時購入はレシート単位を基準とし、会員以外の顧客も分析対象にする事。
- さらに、会員顧客に限定して、ラビナスとの同時購入確率の高いブランドベスト10を求めなさい。ただし、会員顧客は1日に1度来店するものとして、年月日でユニークすることにする。
- 上記2つのスクリプトから出力された結果を比較し、共通するものと違うブランドがそれぞれ入っているか、目で確かめてみてください。
3-2 データがあるとここまでできる!時系列データを考慮したバスケット分析
- 上記の同時関連買い分析の応用です。98年1月にラビナスを購入している顧客の中で、もっとも購入されている確率の高い他のブランドを求めましょう。もちろん、これは会員顧客限定です。これによって、同時購入以外の関連性分析が行えます。意味が分かりますか?
3-3 ブランドロイヤリティを測定しよう!ブランドスウィッチアプローチ
- 98年1月、2月の中で、ラビナスを購入し、その後、もう1度ラビナスを購入した顧客の全体に占める割合をを求めましょう。つまり、2ヶ月中に連続して、ラビナスを購入した人の割合です。もちろん、これも、会員顧客でないと求めることはできません。
3-4 さらに詳しく分析すると
- 1)ラビナス関連商品の中で、購入確率6%以上のブランドを3種類以上購入している顧客をセレクトしなさい。
- 2)3回以上連続して、ラビナスを購入している顧客で、もっともよく購入されている他のブランドを調べましょう。