データ分析プロジェクト初心者必見!書籍『14のフレームワークで考える データ分析の教科書』をデータサイエンティストが読んで得た学び

コンサル
元教師
元教師

こんにちは!データサイエンティストの青木和也(https://twitter.com/kaizen_oni)です!

今回の記事では、データ分析プロジェクトを推進したことがない人にとっては必読書とも言える書籍『14のフレームワークで考える データ分析の教科書』をデータサイエンティストが読んで、学びがあった部分を噛み砕いて紹介していきたいと思います!

今まで様々な書籍を読んで、データ分析プロジェクトの進め方については把握してきたつもりでしたが、本書ほど現実に即した解像度でデータ分析プロジェクトの進め方から最終的に報告をするところまで説明してくれている書籍は他にないと思いました!

みなさんも本記事を読んで、本書籍がいかに具体的にデータ分析プロジェクトの進め方について記載をしているのか、その片鱗をご理解いただけると幸いです!

本書の概要

本書は、データ分析の専門家の方々に向けた書籍ではありません。128ページの「QC7つ道具」と「新QC7つ道具」活用例一覧を見ていただくとわかりますが、経営企画や商品開発、営業や販売促進、調達や購買などに携わる方々で、それも初めてデータ分析に取り組む人、また、なかなかうまくできないと悩んでいる人向けに、できるだけ専門用語を使わずに、平易にまとめたものです。

髙橋威知郎『14のフレームワークで考える データ分析の教科書』(かんき出版/2014) P4

本書は書籍の冒頭にもあるように、データ分析を行うデータサイエンティスト向けというよりかは、データ分析が本来の業務の中心ではないが、データ分析をする必要がある部門の方々を対象として書かれている書籍になります。

そのため、「機械学習」「重回帰分析」のようなデータ分析に関わる専門用語は出てこず、どちらかというと「ビジネス課題に対して、簡単な可視化から始めて、どのようにクリティカルな部分を発見し、ロジックを組み立てていくか」という課題解決のためのデータ分析、という点にフォーカスをして書かれている1冊になります。

そのため、本書を読んだ読後感としては、

「データ分析をうまいことできそうだ!」

という自信が湧いてくる不思議な書籍となっています。

本書の章立ては以下のようになっています。

  • 第Ⅰ部: 理論編
    • 3つのツールを使って「準備」する
    • データを「集める」際は3つのポイントを守る
    • 3つのポイントに注意して「分析」する
    • 「表現」の工夫次第で説得力が変わる
    • 伝えるべき相手に合わせた表現で「伝える」
  • 第Ⅱ部: 事例編
    • 高収益体質に生まれ変わるために製品選定を見直す
    • 店舗の売上をさらに伸ばすために新規のセットメニューを考える
    • 売上に貢献した顧客別DM作戦でリピート率を上げる

前半の部分で「そもそも何を分析すべきか」という課題理解から最終的な分析報告の際の表現方法まで、網羅的にカバーしており、データ分析初心者でも安心の章立てとなっています。

その上、後半では今まで学んだフレームワークをもとに事例を読み解いていくため、実際の実務での活用のイメージも湧きやすく、データ分析の際の辞書的1冊となることは間違いありません。

本書から得た学び

私が本書から得た学びは以下の3つです

  • いかにして定量分析と定性分析を組み合わせるか
  • メインメッセージからファクトを整理する方法
  • デリバリーシナリオを作ることの重要性

順を追って解説していきます。

いかにして定量分析と定性分析を組み合わせるか

集めたデータが定量データばかりであったとしても、アクションに結びつけるためには定性分析が必要となります。

定性分析なくして、アクションには結びつかないということをしっかりと理解しておいてください。

髙橋威知郎『14のフレームワークで考える データ分析の教科書』(かんき出版/2014) P90

データ分析という言葉を聞くと、「売上やクリック率のような数字に基づいた分析」をイメージしがちかと思います。

そのようなイメージで分析を進めていくと、売上数のヒストグラムを出してみたり、売上予測を行って時系列グラフとして出力したりしますね。

そして、

「売上ではこの辺りのレンジが最もボリュームゾーンであることが分かりました!」

「売上はこのような説明変数によって95%の精度で予測できるようになりました!」

と意気揚々と報告をしてしまうかもしれません。

ですが、その報告だけでは「So What?」(で、何?)なのです。

「So What?」で留まらないためには、そもそもの課題の深掘りや従来的な意思決定の方法を担当部門にリサーチし、どのような意思決定に変容することができればビジネス的なインパクトを生み出せるのかといった「定性分析」を行う必要があります。

定性分析を行った上で、ありうる仮説を構築し、その仮説を実施に「定量分析」で検証することによって、仮説の正否を確かめる。

仮説に対する結論から、現在起きている現象の真因を特定し、それに対する対処方法を「定性分析」する。

定性分析した上でできたありうる解決策について、本当にその解決策が有効であるのかを実証しながらデータを集め、再度「定量分析」をする。

定量分析と定性分析を適切に組み合わせて行っていくことによって、ビジネスに寄与するデータ分析は進んでいくのだな、というのが本書の学びでした。

メインメッセージからファクトを整理する方法

本書において、報告書、提案書、企画書などのデータ分析を行った結果を発表するためのドキュメントは「メインメッセージ」(=一番伝えたいこと)を説得力を持って伝えるためのツールとされています。

では、どのような伝え方をすればメインメッセージを説得力を持って伝えることができるのでしょうか?

この点については、書籍『データ利活用の教科書』に以下のような示唆があります。

分析担当者は、集計・分析結果を「あれもこれも伝えたい」と情報を詰め込む傾向があります。その一方で、情報を詰め込みすぎると、視認性が悪化し、分析結果の理解度が低下します。依頼者が知りたい「分析目的・課題に対する結論とその根拠」に情報を絞る勇気が必要です。

株式会社マクロミル/渋谷智之『データ利活用の教科書 データと20年向き合ってきたマクロミルならではの成功法則』(翔泳社/2023) P290

メインメッセージを定めて、それを支えるような分析結果を積み重ねることによって、メインメッセージの確らしさを補強する、ということが分析報告のドキュメントには求められる、というわけです。

本書では、そのようなメインメッセージを支えるものとして以下の3つが必要であると考えられています。

  • サブメッセージ
  • 根拠
  • 根拠の根拠

サブメッセージ

サブメッセージとは、メインメッセージに対して「WHY?」で深堀をした時に、メインメッセージを支えることとなるメッセージとなります。

例えば、「今後の営業活動は製品Aと製品Bに注力する」というのがメインメッセージであった場合には、「なぜ製品Aと製品Bが注力商品なの?」というWHYがつきまとうかと思います。

そのWHYに対するアンサーとして

  • 「製品Aは、購買数が多いかつ利益率が高いため、営業リソースを割くべきである」
  • 「製品Bは、利益率は低いものの顧客が弊社を知るきっかけとなる商品であり、長期的な売上増加のためには製品Bの営業強化による自社認知率向上が重要である」

のようなサブメッセージが存在するものと考えられます。

メインメッセージの1段階下のサブメッセージだけではWHYの深堀が不十分な場合においては、もう1段階サブメッセージを深掘りすることによって、次の「根拠」に繋げていきます。

上記の場合は、サブメッセージ「製品Bは利益率は低いものの顧客が弊社を知るきっかけとなる商品である」のサブメッセージとして、「製品Bは全顧客に占める新規顧客による購入率が高い」というサブメッセージが考えられます

根拠

根拠とは、サブメッセージを支えるデータの可視化の結果や分析の結果を指します。

例えば、サブメッセージ「製品Bは全顧客に占める新規顧客による購入率が高い」を支える根拠としては「製品別の当月新規顧客購入率の棒グラフまたは折れ線グラフ」が考えられます。

根拠の根拠

根拠の根拠とは、根拠となるプロットを導出するのに使用したデータのことを指します。

根拠「製品別の当月新規顧客購入率の棒グラフまたは折れ線グラフ」の根拠としては、「顧客ID-POS」などが考えられます。

そして、上記のようなメインメッセージ、サブメッセージ、根拠、根拠の根拠をツリー状に繋げたものがストーリーボードとなり、メインメッセージを主軸に据えたドキュメントを作る際の全体の地図になります。

デリバリーシナリオを作ることの重要性

デリバリーシナリオとは、相手にメッセージを気持ちよく受け入れてもらうための状況作りです。

髙橋威知郎『14のフレームワークで考える データ分析の教科書』(かんき出版/2014) P178

社内での分析結果報告や社外に対するデータ分析に基づく提案においては、発表時間・訪問時間が限られている場面があります。

そのような場面において、分析結果のみを話していて発表時間・訪問時間が終わってしまっては、分析結果に対する質疑応答や提案された施策についての議論の時間がなくなってしまい、結果として「この時間はなんだったのだろう」というような事態を招いてしまう恐れがあります。

そのような事態に陥ることがないように、資料作成段階からデリバリーシナリオを注意深く精査し、デリバリーシナリオに基づいて発表資料などのボリュームを決めていく必要があります。

例えば、取引先への提案で会議時間が1時間しか存在しない場合に、提案内容についてのディスカッションを20分、質疑応答の時間を10分確保しようと思うと、必然的に分析結果・提案内容の発表の時間は30分以下と決まってきます。

そして、提案内容の発表が10分だとした場合に分析結果の発表は20分以下と確定します。

そのような事前の算段なしに分析結果に関する資料を作ると、あの分析についても報告したい、この分析についても報告したい、となってしまい、結果として20分をオーバーするような分析結果の資料が完成してしまう恐れがあります。

しかし、その会議におけるゴールは分析結果について理解してもらうことではなく、提案内容について提案先企業に納得してもらえるか、その根拠としての分析結果に納得してもらえるかであって、分析結果のみに納得してもらえばいいわけではありません。

資料を作っている際にゴールを見失わないためにも、関係者間でデリバリーシナリオについて合意し、それぞれのセクションで使える時間に基づいた資料作成を行う必要があるのです。

まとめ

今回の記事では、データ分析プロジェクトを推進したことがない人にとっては必読書とも言える書籍『14のフレームワークで考える データ分析の教科書』をデータサイエンティストが読んで、学びがあった部分について紹介していきました!

本書には本記事で紹介した以外にも、実際のケースに沿った定量分析・定性分析の進め方が載っていたり、ビジネス課題に応じてどのような定量分析・定性分析を使い分けるべきかといった具体的なハウツーが載っていたりと、より多くの学びがあります!

本記事を読んで気になった方は、ぜひ本書を手に取ってみてください!

コメント

タイトルとURLをコピーしました