データ分析

コンサル

データ分析プロジェクト初心者必見!書籍『14のフレームワークで考える データ分析の教科書』をデータサイエンティストが読んで得た学び

今回の記事では、データ分析プロジェクトを推進したことがない人にとっては必読書とも言える書籍『14のフレームワークで考える データ分析の教科書』をデータサイエンティストが読んで、学びがあった部分を噛み砕いて紹介していきたいと思います! 今まで様々な書籍を読んで、データ分析プロジェクトの進め方については把握してきたつもりでしたが、本書ほど現実に即した解像度でデータ分析プロジェクトの進め方から最終的に報告をするところまで説明してくれている書籍は他にないと思いました! みなさんも本記事を読んで、本書籍がいかに具体的にデータ分析プロジェクトの進め方について記載をしているのか、その片鱗をご理解いただけると幸いです!
R

Rでベイズに関する理解を深めよう!『ベイズ分析の理論と応用』を現役DSが読んで得た学び

今回の記事では『Pythonによるベイズ統計学入門』に並ぶベイズ分析の入門書『ベイズ分析の理論と応用』を現役データサイエンティストが読んで、得た学びについて共有させていただきたいと思います。 本書は『Pythonによるベイズ統計学入門』とは打って変わって、Rで実装を行うベイズ分析の入門書になりますが、Rコードの分量は圧巻の分量であり、否が応でもR言語でのベイズ分析について理解が深まる1冊となっております。 また、実データを使ったベイズ分析も豊富に紹介されているため、理論に止まらない、かゆいところまで手が届く1冊となっております。
Python

Pythonでベイズ統計学を学ぶなら!『Pythonによるベイズ統計学入門』を読んでデータサイエンティストが得た学び

今回の記事では、ベイズ統計学の入門的な内容をPythonで実装しながら学べる『Pythonによるベイズ統計学入門』を読んで、現役データサイティストが得た学びについてご紹介していこうと思います! 本書は頻度統計学にはないベイズ統計学特有の概念について、Pythonでコードを実装して可視化を行いながら理解を進めることができるので、数式・コードの両面からベイズ統計学に関する理解を進めることができる1冊になっています。 本記事ではその中から特に学びになった内容を噛み砕いて解説していきますので、ぜひ気軽にご覧になってください!
データ分析

ID-POSデータを使ったマーケティング分析手法を学ぶ!「ID-POSマーケティング」から現役DSが得た学び

今回の記事では書籍「ID-POSマーケティング――顧客ID付き購買データで商品・ブランド・売り場を伸ばす」を読んで、現役のデータサイエンティストがためになった内容を簡潔にまとめて皆さんに共有したいと思います。 コンビニやスーパーなどでPOSデータが収集されていますが、そこに顧客の性年代などの情報が紐づいたID-POSデータでは、POSデータと違ってどのような分析を行うことができるのかについて詳述されているのが本書になります。 本記事を読んで、ID-POSデータでできることについての知見を深めていただけると幸いです!
コンサル

仮説の確度を引き上げる!『筋の良い仮説を生む問題解決の「地図」と「武器」』から現役DSが得た学び

今回の記事では、問題解決のためのナビゲーションとなる1冊『筋の良い仮説を生む問題解決の「地図」と「武器」』を現役DSが読んで得た学びについて、皆さんにご紹介させていただきたいと思います。 本書は「データ利活用の教科書 データと20年向き合ってきたマクロミルならではの成功法則」の参考文献として載っていた書籍なのですが、データ利活用の教科書に引用されている部分だけでも学びがあったので、原典を当たったらどんなに学びがあるだろうと思い買ったのですが、買って大正解でした。 データ分析などで重要な「初期仮説」などをどのように立てていけばいいのか、そもそも問題解決においてどうして「仮説」が必要なのかなど、データ分析担当者もデータ分析プロジェクトに関わるビジネスオーナーも、データ分析とは言わず何らかのビジネス課題を解決したいビジネスパーソン一般の方にも学びのある1冊かと思います。 ぜひ本記事を読んで、本書の内容についての解像度を上げていただけると幸いです!
データ分析

統計学界の青本!現役DSが「自然科学の統計学」得た学びをご紹介

今回の記事では、統計学界の青本「自然科学の統計学」を読んで現役DSが得た学びをご紹介していきたいと思います。 本書は東大出版の統計学シリーズの2作目にあたる本で、統計学界の赤本「統計学入門」で統計学の基礎について学んだのちに待ち受ける、統計学の発展的な内容について解説された1冊になります。 本書は初版1992年に発行された歴史ある統計学書でありながら、統計学者必見の書として語り継がれており、丁寧な説明、図表、ふんだんな演習問題によって統計学に対する理解を統計学入門以上に深めることができる1冊となっています。 本記事では本書から私が得た学びのエッセンスをみなさんにご紹介させていただきたいと思います!
PowerBI

データを利活用したいビジネスマン必見!「データ利活用の教科書」を読んで現役DSが学びを得た点

今回の記事では、データ利活用支援・コンサルティングの老舗であるマクロミルの知見が盛り込まれた「データ利活用の教科書 データと20年向き合ってきたマクロミルならではの成功法則」から現役データサイエンティストの私が得た学びを紹介していきたいと思います。 本書は対象者をデータサイエンティストのような統計学やエンジニアリングに特化した専門家に限定しておらず、データ分析を行うにあたっての論点の整理やマーケティングの考え方、データを集めるための調査の設計の仕方など、データ利活用をしたい!と考えている方にとって広く有用な書籍となっています。 本記事では本書の中から私が学びになったと思ったエッセンスを抽出して紹介させていただきますので、ご参考にしていただけると幸いです!
コンサル

データ分析の転ばぬ先の杖!現役DSが「データ分析失敗事例集」から得た学びを書き連ねてみた

今回の記事では、データ分析の成功事例集ではなく、あえて失敗事例集を集めた「データ分析失敗事例集 失敗から学び、成功を手にする」について、現役データサイエンティストが得た学びを共有させていただきたいと思います! この本はデータ分析における「こんな失敗あるよね〜」と思わず唸ってしまうような失敗集がフィクションながらもリアルに書き連ねられており、車の教習所で見るヒヤリハットの動画のような「明日は我が身かもしれない」と思わされる事例がこれでもかと詰められています。 本記事では、本書を読んで私が「この本で先に知ることができてよかった...」と思った事例を3選してみなさんにご紹介させていただきます。 本書の素晴らしさは私が選んだ3選にとどまらず、なんと25もの事例が載っていることなので、本記事を読んで気になった方はぜひ本書を手に取ってみてください!
Python

「自然科学の統計学」第8章演習問題1-線形確率モデルとの比較をPythonで解いてみた

今回の記事では、統計学の青本「自然科学の統計学」の第8章-演習問題1「線形確率モデルとの比較」をPythonで解いていきたいと思います。 今回の問題は非常にシンプルな単回帰モデルの構築なので、かなり理解いただきやすいかと思われます。
Python

「自然科学の統計学」第5章演習問題6のブラッドリー・テリーのモデルへの$\chi^2$適合度検定をPythonで解いてみた

今回の記事では、統計学の青本「自然科学の統計学」の第5章-演習問題6「ブラッドリー・テリーのモデル」にPythonを適用して問題を解いていきたいと思います。 今回実装するPythonコードの詳細については別記事で紹介しているので、本記事では実装コードと結果について簡単に共有させていただきます!