いちリサーチャーの日記

勉強の記録や自分の生活の観察、考えたことなど

LINE DEVELOPER DAY2019レポート③B1-3 コミュニケーションアプリ「LINE」の機能改善を支えるデータサイエンス

LINE DEVELOPER DAY2019レポートの3記事目です。

以前参加した説明会でデータサイエンス部門の方が登壇すると聞いて、楽しみにしていたセッションでした。会場は満員で事前のブックマークの数も多かったそうで、日本のLINEに対するデータサイエンスへの期待の大きさ(あるいはデータサイエンスの裾野の広さ)を感じました。

B1-3 コミュニケーションアプリ「LINE」の機能改善を支えるデータサイエンス / LINE 高口太朗

speakerdeck.com

LINEアプリの機能改善を支える、データサイエンスチームの知られざる裏側 - ログミーTech

印象に残った内容

  • LINEにおけるA/Bテストは単にいずれかの勝ち負けを見るだけでない。サービスを改善する示唆を得る機会だと考えている。
  • 何かの指標が大幅に改善した時は、他の何かが犠牲になったのではないか(と考えて、他方面からも検証する)

 

「グループ作成」という課題設定について*

Q:そもそもユーザーのグループ作成が成功することによるサービス/ビジネス的な価値は何ですか。また、さほど失敗する印象を受けないのですが、かなり昔の事例なのでしょうか。

A:ビジネス的な価値はユーザーのアクティブ率が上がること。グループに所属していないユーザーはLINEをやり始めても使わなくなっていってしまう。

グループ作成はやり慣れている人の感覚だと、どこに失敗要素が?と感じると思う。実際に社内の人間もそう思っていた。時期的には自分が入社して以降なのでここ2年半以内。しかし、LINEは大きなサービスなので、日々初めて使う人はいるし、グループ作成に失敗している人もいる。

 

性別年代のカテゴライズについて

Q:グループ作成の失敗率は年代とも相関がありましたか。

A:必ずしもそうでないと思う。というか、性別・年代の実データは分析者側は持っていない。誕生日の記入は任意記入だし、セキュアな別の場所に保管されているためアクセスできない。推定によるラベルなので、あまり性別・年代で考えることには意味がなく、それよりもふるまいで考えた方がよい。

 

自分は生年月日を登録していたので、すっかり実データを持っている、という認識だった。いわゆる「個人情報」をどこまで取得するか、取得した上で誰まで何まで利用できるようにするのか、というのは最近の重要かつ繊細なテーマだなと感じている。

3箇所に導線を置くという解決策について*

Q:ユーザーのために3箇所に導線を置いたということのことでしたが、限られた画面の中の3倍の面積を割いてしまっているのではないでしょうか。代わりに削ったものはなんだったのでしょうか。

A:実は代わりに削ったものは特になく、3倍の面積を割いているわけでもない。2箇所はもともとあった入口。

一番初めにグループ作成のボタンがあった箇所が不自然な箇所だったため、それを削っても良いのではないかと考えていたが、初期から利用しているユーザーの利用が多く、最終的には3箇所とも残した。

 

ABテストとユーザーへの配慮について*

Q:自分は遠方に住む親にスクリーンショットで操作説明をする場合があります。ユーザーによって違う画面を出すことによるユーザー側での弊害はないのでしょうか。

A:ABテストを実施する際には、カスタマーセンターに対象となるユーザーIDと実際の画面を展開している。また、デバイスやアプリのバージョンにより画面表示は異なるので、そこまで人と画面が違うということに違和感があることはないと考えている。実際にカスタマーセンター等から、そのような声があがってきたこともない。 

Q:カスタマーセンターとの連携は、そこまでやっているのか…!という印象を受けました。今日様々なセッションを聞いたり、社員の方と話したりする中で、ユーザーに対して凄く誠実な印象を受けたが、何がそうさせているのでしょうか。

A:利用するユーザーが多いため、1%であっても人数に換算するとその影響は膨大。また、無料アプリであるため、ユーザーは不快な体験をしたらいつでも利用を辞めることができる。そのため、ユーザーファーストを意識した運営になっていると思う。

 

LINEのDataScientistに必要なコーディングスキルとは*

Q:コーディングに関しては、SQLPython、Rなどのひとしきりの統計関数等が使えればよいのでしょうか。

A:中途に関してはそのレベルでは足りない。SQLはまず必須。自分が分析したいデータが使いたい形であるとは限らないため、必要な形に加工して取得できることが必要なため。その上で大規模データを扱う上での勘所が必要。データ量が多いため、扱い方を間違えるとものすごく時間がかかってしまう。

 

全体を通しての感想

数字に対する向き合い方が人間的で好きだなぁと思った。

私自身、今の職場で尊敬する先輩に「統計的に有意であることは、必ずしも実態として意義があることを意味しない」「指標というのは実態をなんとか計測するために単純化したもの。測れていないものがあることを忘れてはいけない」と教わったこともあり、数字も数字じゃないものもみて、よりよい意思決定ができるようになりたいなと考えている。

程度の適切さを迷うところはあるけれど、望ましい結果を得られたときに「本当にそう?」と思える慎重さと、数字を解釈できるだけの点への理解は重要だと思っている。

 

共感や憧れが募る一方で、自分の甘さや足りなさに苦しくなる部分はあったけれど、実際にそれをやっている方に直接お話や疑問に思ったことを聞けて大変有意義だった。「いい話聞いたなー」で終わらないようにしよう。

 

takatsuka.hatenablog.com

takatsuka.hatenablog.com