Se ha denunciado esta presentación.
Se está descargando tu SlideShare. ×

Webマーケティングを通じたデータサイエンティストの価値発揮方法

Anuncio
Anuncio
Anuncio
Anuncio
Anuncio
Anuncio
Anuncio
Anuncio
Anuncio
Anuncio
Anuncio
Anuncio
Cargando en…3
×

Eche un vistazo a continuación

1 de 52 Anuncio

Más Contenido Relacionado

Similares a Webマーケティングを通じたデータサイエンティストの価値発揮方法 (20)

Más de E2D3.org (20)

Anuncio

Más reciente (20)

Webマーケティングを通じたデータサイエンティストの価値発揮方法

  1. 1. Webマーケティングを通じた データサイエンティストの価値発揮方法 滋賀大学 データサイエンスセミナー 2020年9月29日 代表 五十嵐康伸、博士(理学)
  2. 2. 概要 • 新サービスの設計・開発・運用・保守・販売に対して、データサイエンスを用いた改善 が近年期待されている。 • 本講演では、Webマーケを軸に、運用・販売におけるデータサイエンティストの価値発 揮方法を概説する。 特に 1. PJ(プロジェクト)の目標設定方法 ← 相手のwinを知る方法、相手のneedsを知る方 法 2. データの利用方法 3. 社外<社内のコラボレーション方法 ← を分からないと、恐怖 について、民間企業における具体例を紹介する。 ← 社名・サービス名・主語は曖昧に
  3. 3. 本セミナーのスコープ • 開発=売るものを作る • セールス=売る仕組みを作って実行 • マーケ=売れる仕組みを作って実行
  4. 4. 要件定 義 設計 構築 運用 監視 保守 本セミナーのスコープ 2. 既存事業 Idea Verification CPF: customer problem fit PSF: problem solution fit PMF: product market fit Transition to Scale 1. 新規事業 課題の一覧化 課題の絞り込み 具体化 プロトタイプの作成 MVPの作成 メトリクスの測定 ユニットエコノミクス の健全化 [起業の科学]
  5. 5. • Webマーケ(ティング)の話と聞くと UU、PV、CV、CVR、ROI、CTR、CPA、CPC と横文字の単語の説明を想像されたり • データサイエンティストと聞くと 統計、機械学習の理論や実装方法の説明を想像されたり する方が多いかもしれませんが
  6. 6. 概要 • 新サービスの設計・開発・運用・保守・販売に対して、データサイエンスを用いた改善 が近年期待されている。 • 本講演では、Webマーケを軸に、運用・販売におけるデータサイエンティストの価値発 揮方法を概説する。 特に 1. PJ(プロジェクト)の目標設定方法 ← 相手のwinを知る方法、相手のneedsを知る方 法 2. データの利用方法 3. 社外<社内のコラボレーション方法 ← を分からないと、恐怖 について、民間企業における具体例を紹介する。 ← 社名・サービス名・主語は曖昧に
  7. 7. 恐怖のロールプレイ • あなたは事業会社(例えば、EC)のWebマーケ部に新 人データサイエンティストとして配属されました *EC:五十嵐が経験したことがない業種です • (DSの実務経験はない)上司から「まー、自分で色々 調べて、何をしたいか自分で考えてみて。困ったことが 出てきたら何でも相談してね」と(自由だけど何も具 体的ではない)指示を受けました
  8. 8. 2. データの利用方法の問題 テーブル定義書・ER図がない、作れていない 変数名とコメントから中身を推測 → できるか!
  9. 9. 2. データの利用方法の問題 テーブル定義書が複数ある チームメンバー毎に持っているversionが皆違う あの人が最新版を持っているよ → そんな助言はいらん version管理してくれ!
  10. 10. 2. データの利用方法の問題 異なるDBに、同じテーブル名がある、でも中身は違う 異なるtableに、同じコラム名がある、でも中身は違う → 命名規則を決めてくれ! → 頭を下げて同じ部署の先輩に聞きに行く 2-3回は教えてくれるけど、その後は「DB担当に聞いて」と言われる → 頭を下げてDB担当に聞きに行く 2-3回は教えてくれるけど、その後は「別のDB担当に聞いて」と言われる → いつまで経ってもデータの全体像はすっきり分らない
  11. 11. 2. データの利用方法の問題 • 2000年のITバブルから、20年増築を行った九龍城砦 • 誰も全体を理解できない
  12. 12. 1. プロジェクトの目標設定方法の問題 今ある古いリコメンドエンジンよりも性能の良い 新しいリコメンドエンジンを開発しようよ → 社内の先輩が作った古いリコメンドツールが性能が悪い と証明したら、先輩を否定することになる なので、開発できない → 人の評価と性能の評価は分けてくれ
  13. 13. 1. プロジェクトの目標設定方法の問題 "最新のpythonライブラリーを使って" 今ある古いリコメンドエンジンよりも性能の良い 新しいリコメンドエンジンを開発しようよ → AWS上で動かないよ、速度でないよ PySparkで動くライブラリーだけを使って → それはわかる でも、それは部署共通の開発ルールとして、新人には先に 教えてくれ
  14. 14. 1. プロジェクトの目標設定方法の問題 "自作のpythonライブラリーを作って" 今ある古いリコメンドエンジンよりも性能の良い 新しいリコメンドエンジンを開発しようよ → 別のPJ用に買った市販のリコメンドエンジンで十分じゃな い? → それはわかる でも、それなら部署共通の開発ルールとして、新人には先に 教えてくれ
  15. 15. 概要 • 新サービスの設計・開発・運用・保守・販売に対して、データサイエンスを用いた改善 が近年期待されている。 • 本講演では、Webマーケを軸に、運用・販売におけるデータサイエンティストの価値発 揮方法を概説する。 特に 1. PJの目標設定方法 ← 相手のwinを知る方法、相手のneedsを知る方法 2. データの利用方法 3. 社外<社内のコラボレーション方法 ← を分からないと、誰も協力・動いてくれない について、民間企業における具体例を紹介する。 ← 社名・サービス名・主語は曖昧に
  16. 16. 大学の授業「体系的、歴史的、客観的」:15コマ x n 回 < 企業の現場「単発的、現代的、主観的」:1コマ x 1回
  17. 17. セミナーの想定:新入社員向けの研修 年齢 エキスパート職 マネージメント職 役割 Commit to the 22-27 エンジニア 与えられた仕事をこなす Process 27-34 シニアエンジニア チームリーダー 二人仕事の責任者 資格を取る (他の業界・別の職種への転 職も考える) Result 35-42 チーフエンジニア、 グループリーダー マネージャー 難しい仕事が回ってくる 人をまとめるのに特化 Result ResultにCommit(価値発揮)できるようになって欲しい Resultとは何か?を自分で考えられるようになって欲しい by 先輩
  18. 18. 概要 • 新サービスの設計・開発・運用・保守・販売に対して、データサイエンスを用いた改善 が近年期待されている。 • 本講演では、Webマーケを軸に、運用・販売におけるデータサイエンティストの価値発 揮方法を概説する。 特に 1. PJの目標設定方法 ← 相手のwinを知る方法、相手のneedsを知る方法 2. データの利用方法 3. 社外<社内のコラボレーション方法 ← を分からないと、誰も協力・動いてくれない について、民間企業における具体例を紹介する。 ← 社名・サービス名・主語は曖昧に
  19. 19. 目標設定がなぜ重要か? 段取り八分、仕事二分 準備8割、実行2割 評価関数が決まったら、制御工学の問題は8割終わってい る 目的変数(と説明変数)を決めれたら、DSの問題は8割終 わっている What > How (本セミナーで証明はしません、お許しください)
  20. 20. 概要 • 新サービスの設計・開発・運用・保守・販売に対して、データサイエンスを用いた改善 が近年期待されている。 • 本講演では、Webマーケを軸に、運用・販売におけるデータサイエンティストの価値発 揮方法を概説する。 特に 1. PJの目標設定方法 ← 相手のwinを知る方法、相手のneedsを知る方法 2. データの利用方法 3. 社外<社内のコラボレーション方法 ← を分からないと、誰も協力・動いてくれない について、民間企業における具体例を紹介する。 ← 社名・サービス名・主語は曖昧に
  21. 21. 目標設定の階層 1. 世界 2. 国、政府、自治体 3. 企業 4. 組織 5. PJ
  22. 22. PJとは何か? • 独自の成果物、またはサービスを創出するための期 限のある活動 • 本セミナーでは、仕事と理解してください PMBOK(Project Management Body of Knowledg) プロジェクトマネジメント知識体系ガイド by プロジェクトマネジメント協会
  23. 23. 目標設定の階層 1. 世界 2. 国、政府、自治体 3. 企業 4. 組織 5. PJ PJの目標を、企業の目標と、組織の目標に重ね合わせるこ とが大事 相手にwinが有ると、相手は動いてくれやすい 相手にwinが無いと、相手は動いてくれにくい
  24. 24. 企業の目標設定方法 1. 経営理念(企業理念) 2. Vision-Mission-Value 3. 中期(5年)経営計画 一マーケ社員はだと決定に関わるのは難しい
  25. 25. 経営理念に書かれていること 1. なぜ、われわれは働いているのか? 2. なぜ、この仕事をするのか? 3. なぜ、ここまでやるのか? の哲学 • 絶対的に正しい、絶対的に間違っているはない • 自分達で考えて決めるもの [坂上 仁志、経営理念の考え方・つくり方]
  26. 26. 企業の最大の課題 社会的な正当性の確立 1. Vision (将来像) 2. Mission(使命) 3. Value(価値観) 「儲かる!」は重要 「儲かる!」だけでは人はついてこない 「儲かる!」は手段 [P・F・ドラッガー、ネクスト・ソサエティ]
  27. 27. 企業倫理 (の構成要素、骨格) = 経営理念 Value = How 会社のが持つ/大切にする価値 Product / Service の作成する Mission = What 会社の使命・任務 Vision = Why 会社の目指す姿 As is Will-1:したいこと Can-1:できること Must-1:すべきこと Resource:経営資源(人・物・金・情報)を 自社内 or 他社 or 個人と 交換することで再生産する(増やす) To be:作りたい未来の世界 を実現したい Gap:現在と未来の差を埋めたい 課題(problem)を解決したい As is:現在の世界 物 情報 金 人 人 物 情報 金 「経営目標を一緒に達成しましょうよ。どんどんやり方提案して、 手を動かして、周りと調整して、結果出していきますよ」 と言って結果を出す=価値発揮に必須 仕組みを回す or 仕組みを作ること = 仕事 企業活動とあなたの関係 To be Will-2 Can-2 Must-2 企業B 企業A 人 物 情報 金 あなた Gap Career Path を考えるということ 会社というResourceはGapを埋めてくれるのか? Yes = 会社楽しい、No = 会社楽しくない
  28. 28. 目標設定の階層 1. 世界 2. 国、政府、自治体 3. 企業 4. 組織 5. PJ PJの目標を、企業の目標と、組織の目標に重ね合わせるこ とが大事 相手にwinが有ると、相手は動いてくれやすい 相手にwinが無いと、相手は動いてくれにくい
  29. 29. 組織、個人の目標設定方法 • OKR • MBO • KGI-KSF-KPI
  30. 30. OKR:Objectives and Key Results 目標と主要な結果 図表削除 https://note.com/kengomori/n/ncaf88a5a94dc
  31. 31. 目標設定方法の違い 図表削除 https://note.com/kengomori/n/ncaf88a5a94dc https://www.hito-link.jp/media/column/okr/kpi_kgi
  32. 32. 目標設定の階層 1. 世界 2. 国、政府、自治体 3. 企業 経営理念:Vision-Mission-Value、中期(5年)経営計画 4. 組織:OKR、KGI-KSF-KPI、MBO 5. PJ PJの目標を、企業の目標と、組織の目標に重ね合わせることができたら 社内のメンバーが協力してくれる=相手を動かせる その他の方法で設定してPJを始めようとしても 「It‘s not my business」 「It‘s not your business」
  33. 33. 事業会社における DS業務のイメージ <機械学習クエスト〜ドラゴンクエスト> • 竜王(機械学習)にたどり着くまで 80% • 竜王(機械学習)を倒す 20% • 機械学習の(Kaggle的な)問題を作ること 80% • 機械学習の(Kaggle的な)問題を解くこと 20%
  34. 34. 概要 • 新サービスの設計・開発・運用・保守・販売に対して、データサイエンスを用いた改善 が近年期待されている。 • 本講演では、Webマーケを軸に、運用・販売におけるデータサイエンティストの価値発 揮方法を概説する。 特に 1. PJの目標設定方法 ← 相手のwinを知る方法、相手のneedsを知る方法 2. データの利用方法 3. 社外<社内のコラボレーション方法 ← を分からないと、誰も協力・動いてくれない について、民間企業における具体例を紹介する。 ← 社名・サービス名・主語は曖昧に
  35. 35. Result = 価値 <経営層がやりたいこと> • 「不確実な情報」の中で、「資源をどのような施策(アクション)に使う か/使わないか」を意思決定したい • 「意思決定の確度を高めるための情報」をデータから作って欲しい欲 しい <分析の成果物> • 実行してほしい/欲しく無い 施策を3行のStoryで提案 • 図表、数値は提案の根拠、必須で見せるのは最小、その他は聞か れたら出す • 図表、数値から話すと「so what?結論から言って」と返事が返ってく る
  36. 36. 0:意思決定したいことの明確化 経営視点を忘れちゃダメよ <意思決定表、チェックリスト> 事業の課題 Webマーケ の役割 事業拡大 新商品開発 本セミナーのスコープ外 事業拡大 新規顧客の獲得 ・コンセプト把握(顧客像、商品ベネフィット)→クラスタリング分析、因 子分析、主成分分析、コレスポンデンス分析 ・流入経路改善→アトリビューション分析(主にオンライン) 事業安定化 既存顧客のランクアップ ・クロスセル・アップセル→併買分析、価格帯分析 ・販促効率アップ→回帰分析、協調フィルタリング 既存顧客のランクダウンの防止 ・離脱防止→チャーン分析
  37. 37. Step by Step のすり合わせを忘れちゃダメよ <分析フレームワーク> 3.問題としている現象・事実の明確化 4. 必要な情報・データ・ロジックの明確化 5. 現象の把握 6. ビジネス全体における課題の特定 7. 施策につながる分析結果 8.報告と合意形成 9. 施策の意思決定 2:分析手順の明確化
  38. 38. 3:問題としている現象・事実の明確化 言われたのをぼんやりうけとっちゃダメよ 前提知識・バックグラウンドに違いがあることを忘れちゃダメよ <問題候補表> 比較対象 (ベンチマーク) 比 差 対 前年 対 前月 対 都道府県 対 計画 対 競合 対~
  39. 39. 4:現象・事実をとらえるのに必要な 情報・データ・ロジックの明確化 手持ちのデータから考えちゃダメよ データから分析しちゃダメよ どんなデータでも使えると思っちゃダメよ <必要材料表> 現象 必要な情報 データ ロジック 前月比 前月情報 前年比 前年情報 計画比 計画値&計画値のロジッ ク情報 他エリア比 他エリア情報 競合比 競合IR情報
  40. 40. 5:現象の把握 現象 必要な情報 データ ロジック 前月比 前月情報 前年比 前年情報 計画比 計画値&計画値のロジッ ク情報 他エリア比 他エリア情報 競合比 競合IR情報
  41. 41. 6.ビジネス全体における課題の特定 点から始めてはダメよ、木を見て森を見ずはダメよ 丸ごと飲み込んじゃダメよ ブレイクダウンしないとだめよのシーン <ビジネスプロセス図> 例)売上の減少 売り上げが下がった要因に行く前に、まずはビジネスの構造把握 課題は複層的(多層的、階層的)で注目点の前後にあるかも ボトルネックの洗い出し、制御可能 or 不可能変数の列挙 図表削除 https://www.netyear.net/idea/dt20181108.html
  42. 42. 7: 施策につながる分析結果 分かる・発見だけじゃダメよ。打ち手・施策につながらなきゃダメよ。 <施策比較表> 例)施策が販促 施策対象の種類 制御可能な変数 施策内容 コスト リターン Who 販促ターゲット顧客 What モノ、コト 商品 When 実施タイミング 冬にアイスは受け入れられづらい Where タッチポイント CM、交通広告、Web広告、メル マガ、DM、新聞、チラシ、電話、 Why 訴求内容、ベネフィ ット キャッチコピー、クリエイティブ How インセンティブ How many
  43. 43. 分析例 1. 売上予測 ・入力データ形式:時系列x予測対象(売上、伝票数、ユニークユーザ数他) ・手法:ARIMAとか ・アウトプット:予測曲線 2. who ざっくりどんな人たちがお客? ・入力データ形式:ヒトx商品 ・手法:因子分析?主成分分析?⇒クラスタリング ・アウトプット:顧客(ニーズ)のラベル(クラスタリング結果に名前を付けたもの) 3. what よく似た(よく一緒に買われる)商品って何? ・入力データ形式:併買マトリクス(商品x商品)とか? リサーチデータで商品の要素データ見つけてくる感じ? ・手法:相関分析 ・アウトプット:商品(ベネフィットや用途)のラベル(クラスタリング結果に名前を付けたもの) 4. who x what 販促反応予測(退職者予想、新規登録予測、ランクアップ、ランクダウン予測) ・入力データ形式:ヒトx予測対象(反応@特定のwhat) ・手法:ロジスティック回帰、決定木 ・アウトプット:予測スコア、高反応セグメント条件式 5. who x when チャーン予測 ・入力データ形式:ヒトxチャーン ・手法:ロジスティック回帰、決定木 ・アウトプット:予測スコア、チャーンリスクセグメント条件式
  44. 44. 8:報告と合意形成 <報告書、エグゼクティブサマリ> 事実の指摘:Aがどれくらいの規模で起きている。 施策の主旨:Bに対してCを投下することでDという規模の効果を期待 する。 根拠:なぜなら、Eという構造になっているから。 例)施策が販促施策の場合 F月の売上額はG円。 対前年比H%(対前年差△I円)、前月比J%(前月差K円) 増加(減少)の内訳としては、 提案施策による売上増(減)がL%
  45. 45. 8:報告と合意形成 <報告書の粒度> 経営資源の意思決定、何が起きていて、打開策はどう である、の数行の文章、形式を作るのが大事 図表は証拠 文章に違和感がなければ、意思決定者は、図表みな い
  46. 46. 概要 • 新サービスの設計・開発・運用・保守・販売に対して、データサイエンスを用いた改善 が近年期待されている。 • 本講演では、Webマーケを軸に、運用・販売におけるデータサイエンティストの価値発 揮方法を概説する。 特に 1. PJの目標設定方法 ← 相手のwinを知る方法、相手のneedsを知る方法 2. データの利用方法 3. 社外<社内のコラボレーション方法 ← を分からないと、誰も協力・動いてくれない について、民間企業における具体例を紹介する。 ← 社名・サービス名・主語は曖昧に
  47. 47. KPI一覧 https://markezine.jp/word/ 図表削除
  48. 48. マーケ x DSの勉強につかえるデータセット • E-Commerce Data Actual transactions from UK retailer https://www.kaggle.com/carrie1/ecommerce-data 1. InvoiceNo: Invoice number. Nominal, a 6-digit integral number uniquely assigned to each transaction. If this code starts with letter 'c', it indicates a cancellation. 2. StockCode: Product (item) code. Nominal, a 5-digit integral number uniquely assigned to each distinct product. 3. Description: Product (item) name. Nominal. 4. Quantity: The quantities of each product (item) per transaction. Numeric. 5. InvoiceDate: Invice Date and time. Numeric, the day and time when each transaction was generated. 6. UnitPrice: Unit price. Numeric, Product price per unit in sterling. 7. CustomerID: Customer number. Nominal, a 5-digit integral number uniquely assigned to each customer. Country: Country name. Nominal, the name of the country where each customer resides. 8. Descriptionが途中で変わったり、カードの支払いが入っていたりして面白い
  49. 49. マーケ x DSの勉強につかえるデータセット • E-Commerce Data Actual transactions from UK retailer https://www.kaggle.com/carrie1/ecommerce-data • Anime Recommendations Database Recommendation data from 76,000 users at myanimelist.net https://www.kaggle.com/CooperUnion/anime-recommendations-database • Innerwear Data from Victoria's Secret and Others 600,000+ innerwear product data extracted from popular retail sites https://www.kaggle.com/PromptCloudHQ/innerwear-data-from-victorias- secret-and-others
  50. 50. マーケ x DSの勉強につかえるデータセット • Hotel booking demand From the paper: hotel booking demand datasets https://www.kaggle.com/jessemostipak/hotel-booking-demand • New York City Airbnb Open Data Airbnb listings and metrics in NYC, NY, USA (2019) https://www.kaggle.com/dgomonov/new-york-city-airbnb-open-data • E-commerce - Users of a French C2C fashion store Explore user behaviour of 98K users of a successful website https://www.kaggle.com/jmmvutu/ecommerce-users-of-a-french-c2c- fashion-store
  51. 51. マーケ x DSの勉強につかえるデータセット • Amazon sales rank data for print and kindle books 61,000 unique ASINs and 200,000,000 salesrank data points (JSON / CSV) https://www.kaggle.com/ucffool/amazon-sales-rank-data-for-print-and- kindle-books • Instacart Market Basket Analysis Which products will an Instacart consumer purchase again? https://www.kaggle.com/c/instacart-market-basket-analysis/data • Zillow Prize: Zillow’s Home Value Prediction (Zestimate) Can you improve the algorithm that changed the world of real estate? https://www.kaggle.com/c/zillow-prize-1/overview
  52. 52. まとめ 1. PJの目標設定方法 ← 相手のwinを知る方法、相手のneedsを知る方法 2. データの利用方法 3. 社外<社内のコラボレーション方法 ← を分からないと、誰も協力・動いてくれない について、民間企業における具体例を紹介する。 困ったことがでてきたらいつでもメール、SNS等で気軽に相談してください 代表 五十嵐康伸、博士(理学)

×