いちリサーチャーの日記

勉強の記録や自分の生活の観察、考えたことなど

オンライン対談 メルカリジャパンCEO 田面木 宏尚氏 × 博報堂生活総研 酒井 崇匡氏 ~ビッグデータで解き明かす、新しい消費文化~ を聴きました

デジノグラフィの発刊記念イベント。

honto店舗情報 - ★オンライン対談★メルカリジャパンCEO 田面木 宏尚氏 × 博報堂生活総研 酒井 崇匡氏 ~ビッグデータで解き明かす、新しい消費文化~

Twitterで告知をたまたま見て興味を持ったため参加した。リモートワーク×オンラインイベントは、平日でも参加しやすいのでありがたいなぁと思う。

 

概要

ビッグデータ、すなわちVolume(多量)、Variety(多様)、Velocity(多更新)なデータによって細部をクリアに見て、生活者の実像を捉えることができるよ、というお話。

  • 東京女子、東北女子のスマホ画面(利用の多いアプリ)はそれぞれどっち?
  • データからわかる女性の髪の曲がり角は?
  • スーパーの売上が増えるタイミングは5日・15日・25日のどれ?
  • 年末に消費が増える県は?

というような、実例(クイズ)を交えて紹介。

スマホ画面の見分けと、年金の受給日の消費が給与支給日の消費を上回っているという話が、意外性があっておもしろかった。

スマホ画面の見分けは利用の多い順にアプリが並んでいるものから、東京女子・地方女子どちらのものか推測。チェーン店の利用は他に店が無い分地方女子の方が多いかなとか、ECの利用率も高いのではとか、キャッシュレス決済は都会の方が店舗導入が進んでいるのではとか考えたけれど、考えすぎでシンプルに乗り換え検索の順位が見分け方の決め手となっていた。

年金受給日の消費が、というのは、大前提として高齢化が進んでいるからだろうなと思いつつ、給与支給日が過去よりばらけているのかなとか給与労働者はそんなにカツカツな生活をしていない(=給与が支給されたから買い物をするぞ!という行動をしない)などもあるのかなぁなどと思いながら聴いていた。四国かどこかが、他地域と逆のトレンドを示していたのはなぜだろう。

いろいろ気になるし、デジノグラフィ10の技法などもおもしろかったので、本を買って読むのが良さそう。

 

暗に語られた話

メルカリの田面木さんは、分析にはドメイン知識(IT用語ではなく、「領域」。分析しようとする対象、アパレル等)が必要、いくらデータがあっても使えるデータが使える形で存在していないと、や、AIはすべてを解決しない、モデルはやればやるほど人間の手がかかる、というような話をしていて、この辺りは初学者の期待と実態的なところだなぁと思って聞いていた。

プッシュ通知ってうれしいですか?

田面木さんから聴衆への問いかけ。概ね「うれしくない」という反応。

(とはいえビジネス的な効果を求めるとやる必要あるよね、と思ったので)うれしいプッシュ通知を成立させるとしたら、①自分に凄く合っている内容、②頻度が自分に合っている(うるさくない)、③フィードバックができる、あたりが条件かなぁと思った。

自分に寄せて考えると、買おうとしていた商品が割引で買えるor再入荷したよ、とか好きなアーティストのライブがあるよ、とかは実際に受けとって有意義に感じた。

こう考えてみると、いずれも先に「お気に入り登録」のような形で自分が能動的に登録した情報に基づくものである。

じゃあコンバージョンしやすいプッシュ通知に繋がる「お気に入り登録」を増やそうぜ!という考えで、「購入したものに対して、デフォルトがONの状態でのお気に入り登録」みたいなものが生まれているのかなぁ。能動性が欠けると、それは購買履歴と変わらないのであまり意味が無さそう。

 

検索ワードを拡張する/検索されないものを引っかける

メルカリでは、以前はレゴを買っている人のレコメンデーションはレゴに留まっていたが、現在は類似の行動データから他カテゴリにも拡張されているという話。

「偶然の出会いを演出する一方で、獲得効率は下がる(レコメンデーションの精度が下がる)ので、ここはどうなんでしょうね」という話を主に酒井さんがしていた。ターゲットを拡げると精度が下がるよね、でも量も取らなきゃいけないよね、というのは広告とかマーケティングとかのあるあるだなぁと思う。

正確な話の繋がりは忘れてしまったけれど、田面木さんが「スニーカー好きの自分のツボを抑えたレコメンデーションになっているか開発にフィードバックしている」「精度を上げるうえで、例えばアパレルの人とかドメイン知識を持った人の意見をモデルにフィードバックする必要がある」「XXのXXというミリタリージャケットで検索した自分は、ミリタリージャケットが欲しいんじゃなくて、その商品だけが欲しいので、他のミリタリージャケットをオススメされると違うんだよな…と思う」というような話をしていた。

 

関連して「”何で検索したか”、ではなく、”何で検索しなかったのか(無限にはできないけど、ある程度限定して)”という情報をレコメンドに使うことで精度が上げられないか?」という質問をしたら拾って頂けたのだけれど、”何で検索しなかったのか”という言葉が、現在は検索ワードとして使われていないが使われる可能性がある情報や、Why(検索しなかった理由)という意味として受け取られた様子だった。ただ、そこから派生したメタデータ(色とか形とか)を利用したレコメンドの話や、移住されない都市はどういう都市か(おそらくWhyと考えての派生)という話は興味深かった。

「このワードでは検索しなかった」という個性

質問の意図は実はこちらだった。同じクラスタの人がAとBで検索していて、自分はAのみで検索していた場合に、現在だとBをレコメンドされることが多いけれど、「Bでは検索しなかった」という情報を、特徴として活用することで、レコメンデーションの精度が上がるのでは?という考え。

例えばあるコレクションのうち1つをわざとそれだけ持っていない(気に入っていない)としたら、その1つを薦められたら「違うんだよ!」と思う度合いは、全く関係ないものを薦められるより高そうに感じる。

現状ではこれを実現するとしたら、データ量を増やして別クラスタとして判別させる、とか、フィードバック機能やNGリストとして登録させるとかになるのかなぁ。

学習データのリフレッシュ

少しだけ登場したワードだけれど、興味深かった。

学習データは過去からなるものだけれど、人間は変化する生き物なので、適宜リフレッシュをかけないと、データ量に比例して精度が上がらないということは起こる。

「ベビー服など、時系列で不要が予測できそうなもの」「流行という外部データから予測できそうなもの」「本人の嗜好の変化という予測が難しいもの」などいくつか種類がありそう。ここの精度が上がると、未来予測的な方向に使えるようになるのかなぁ。



最近は現業にかまけていて、外部セミナーなどをあまり聴講していなかったので久しぶりだったけれどおもしろかった。自分の視野が広がるし、スピーカーの方との交流の中で、その場でしか発生しないやり取りが拡がっていくことは楽しい。