HOME > 研究活動(研究内容紹介)

研究内容紹介

「データマイニングのビジネス応用のための実践科学アプローチ」研究事業の目的は、ビジネス分野においてデータマイニング技術を応用するため、データマイニングの基礎技術・アプリケーションの開発、消費者行動モデルの開発、そして実践による検証という一連の研究プロセスを包括的かつシームレスに行う研究体制の構築と、世界トップレベルの研究拠点を形成することにあります。

具体的トピックは、以下の3つに大別できます。

1)大規模顧客販売履歴データを用いた顧客管理モデル

100〜200万人規模の顧客販売データを蓄積・分析するための手法開発を行い、膨大な顧客データを効率的に管理する顧客管理システムの理論的・実践的研究を行う。

2)顧客動線データと購買モデルの統合

RFID技術を用いて収集された顧客動線に関するストリーミングデータを解析する技術・手法を開発するとともに、それらと顧客の購買モデルの統合に関する理論的研究を行い、店舗実験を通してその有用性を検証する。

3)多次元時系列データモデリングの広告効果モデルへの適用

10,000を超える時系列属性を含んだ広告視聴データから、統計数理や機械学習などの時系列モデリングを用いた分析により、広告効果測定モデルを構築する。

また、技術的テーマとして以下の3つを挙げています。

1)店内顧客動線に特化したストリームデータマイニング技術の開発

顧客のさまざまな購買行為に関する情報を蓄積しているセンサーネットワークデータ(ストリームデータ)の中でも、特に顧客の店内の移動行為に焦点を当てたデータマイニング技術の開発を行う。

2)データマイニング志向のプラットフォームの開発

上記のストリームデータと顧客の販売履歴データを統合し、マーケティング上の理論的含意を探索するため、これらをシームレスに統合し知識発見を容易にするデータマイニング志向のプラットフォームの開発をすでに開発済みのMUSASHIをベースに行う。

3)新しい消費者行動モデルの構築

既存のマーケティングモデルと比較しながら独自の消費者行動モデルを構築し、店舗実験で得られたデータを用いて科学的な検証を行う。例えば広告理論における露出モデルの理論的検討とストリームデータへの適用可能性を検討する。マーケティングにおける理論的な検討事項について、コロンビア大学のマーケティング研究グループとの共同研究体制で店舗実験の設計を行う。

顧客動線に特化したストリームデータマイニング

顧客はある商品を購入するにあたって、店内でどのような動きをしているのだろうか?今まで見えなかった顧客の動きは購買の何を明らかにするのか?

.

顧客動線データ例

顧客動線データ例

小売業における消費者の購買行動を理解する際には、従来からPOSデータなどの購買データや、会員カードなどから特定した利用者IDをPOSデータに加えたID付きPOSデータなどが利用されてきました。一方で、近年では、情報通信技術の急速な発達から、RFIDと呼ばれる電波を利用した認証技術をカートに取り付けることで、店舗内の顧客動線データとして、顧客の店舗内での巡回行動をデータとして蓄積する試みが行われています。このデータを用いることで、ID付きPOSデータでは把握することが困難であった、店舗内における顧客の巡回行動を明らかにすることが可能となります。
DMラボでは、これまで蓄積してきたID付きPOSデータに加えて、店舗内の顧客動線データを取得する仕組みを構築しています。そして、それら2つのデータを組み合わせることで、いつ、どの顧客が、どの商品をいくらで、どのような巡回経路によって購入したかを特定することが可能となります。しかしながら、これまでに顧客の動線データを利用したマイニングはほとんど行われていないため、分析手法の構築や、指標としての一般化など多くの課題が残っています。
DMラボでは、これまでに培ってきたさまざま分析手法やデータマイニング技術を適用したり、新たな手法を開発したりすることで、これまで分析することが困難であった店舗内の巡回行動を含めた顧客の購買行動を明らかにします。そして、店舗内の購買行動に関する新たな知見の発見と、顧客動線データに対する分析手法の確立をめざしています。

.

広告データマイニング

数万個におよぶ消費者の属性の中から、購入行動に結びつく項目をマイニング手法を駆使して見つけ出し、広告効果を最大化する広告出稿手法を見つけ出す。

昨今の金融危機の影響から多くの企業が経費削減のため、広告コストを何とか減らそうと努力をしています。このような背景から、さまざまな広告メディアにおいて、広告効果に関して高い注目が集まっています。とりわけテレビCMは広告コストの大部分を占めており、テレビCMのコストを削減しつつ、広告効果を最大化することは、多くの企業にとって最重要課題といえます。DMラボでは、テレビCMと消費者の購買行動の関係をマイニング手法を駆使して分析し、最小の予算で広告効果を最大化する最適な広告予算配分手法の確立をめざしています。

しかし、テレビCMと消費者の購買行動に関するデータは数万の属性を持つ超多属性のデータであり、従来の解析手法は簡単には適用できません。

現在、各消費者がいつどの番組を視聴し、その際にどのようなテレビCMを視聴したのか、さらに視聴後と視聴前とで、ある商品の購入量変化があったかどうかに関するデータが集められています。しかしながら、1ヶ月間に放送されるテレビ番組数は数万におよび、そのそれぞれの番組内で放送されるテレビCMは十数個になります。それら個々のテレビCMに対して、消費者が視聴したかしなかったという属性があり、最終的に商品購入に結びつくまでには諸条件の属性分岐があります。そのため、各消費者に関するデータに付随する属性は数万を超え、解析を困難にしています。DMラボでは従来までに研究開発してきた大規模データマイニングツール:MUSASHIなどを用いて、このような大規模データを処理し、また新しい解析手法を研究開発することで、目的とする広告予算配分手法の確立をめざしています。

研究成果報告を行っている国際会議およびWS、SS

.