データ分析

NLP

LLMの教科書「大規模言語モデル入門」を読んで私が得た学び

今回の記事では、LLMにおける教科書的1冊「大規模言語モデル入門」を読んでみて、私が得た学びについてまとめていきたいと思います。 本書は、「LLMを今まで触ったことがないけど、LLMの実装やLLMで何ができるのか知りたい」「Transformerモデルについて理解を深めたい」という方必読の1冊となっております。 本書評を見て、「大規模言語モデル入門」からどのような学びが得られるのかについて解像度を上げていただけると幸いです!
NLP

PII-Detectionコンペにおけるビタビアルゴリズムの実装を図解してみた

今回の記事では、KaggleのThe Learning Agency Lab - PII Data Detectionコンペにおいて、ビタビアルゴリズムを実装してみた時のロジックを、図解しながら解説していきたいと思います。 大規模言語モデル入門の第6章の内容を参考にしながら実装しましたが、ところどころ理解が及ばない部分があり、コンペに一緒に参加した仲間に説明できなかったことが動機となって、今回このような解説記事を書いた次第です。 できる限り分かりやすく解説していきますが、分かりずらい箇所があった場合にはコメント等をいただければ追加説明等を付与いたしますので、お気軽にコメントいただけると幸いです。
Python

fastaiライブラリの協調フィルタリングを使って、君の名は。に類似のアニメを求めてみた

この記事では、Practical Deep Learning for Codersの第7章で学んだ協調フィルタリングの内容を参考に類似のアニメを出力するレコメンドエンジンを作成してみたので、実装のコードを紹介いたします! fastaiライブラリを使えば、比較的簡単に協調フィルタリングを実装することができるので、興味を持った方はぜひご自身でも類似のデータセットを使って実装してみてください!
データ分析

現代麻雀のバイブル「新 科学する麻雀」を読んで私が実践していること

今回の記事では、現代麻雀のバイブルとも言える「新 科学する麻雀」を読んで私が実践していることについて共有していきたいと思います。 本書はオンライン対戦麻雀「天鳳」の最高峰の卓「鳳凰卓」における約92万試合のデータを元に「相手の行動モデル」を再現するシミュレータを作成し、さまざまな状況下における打ち手の選択や収支を調査して1冊の書籍としてまとめた、まさに現代麻雀における聖典とも言える1冊になっています。 皆さんも本記事を読んで、麻雀において科学(=統計)を味方につけて戦うことの素晴らしさに気づいていただけると幸いです!
コンサル

データ可視化の教科書「Google流資料作成術」を読んで得た学び・これから実践したいこと

今回の記事では、データ可視化をする人のための教科書的存在「Google流資料作成術」から私が得た学びとデータアナリストとしてこれから実践していきたいことを共有していきたいと思います! 本書はデータを使って報告書を作成する方、意思決定を行うためにデータを可視化する方など、データを可視化する必要がある様々な方にとって有用な書籍になります! データの可視化は目的ではなく手段であるため、データを可視化することによって行動を変容したら何らかの気づきを得られなければ意味がありません。 ぜひ本記事で、本書から得られる学びは何なのか、本書をどのように可視化に役立てていけばいいのかの外観を掴んでいただけると幸いです!
Python

「データ可視化学入門」を読んでみて得た学び・これから実践したいこと

この記事では「指標・特徴量の設計から始めるデータ可視化学入門 データを洞察につなげる技術」を読んでみて、データサイエンティストの自身にとって学びになったこと・これから実践していきたいことについて記事を通して共有していきたいと思います。 本書はデータサイエンティスト・データアナリストに限らず、なんらかの形でデータを可視化して意思決定をする方・意思決定する人のサポートをする方にも、データの可視化から何を読み取るべきか・データを可視化する時の注意点は何か・目的に対してどのような可視化の手段が考えられるのかを学べる良書かと思います! ぜひ本記事を見て、本書購入の際の参考にして見てください!
Python

hmm.GaussianHMMを実行したら、「AttributeError: module ‘hmmlearn’ has no attribute ‘GaussianHMM’」が出てしまった時の対処法

この記事では、時系列データにクラスタリングを適用する目的でHMMを使用した時に、AttributeErrorが出てしまった時の対処法をお教えいたします! データ可視化学入門のコードを実行している最中に出てきてしまったエラーなので、少しびっくりしたのですが、落ち着いて対処すれば解決可能です! 本記事を参考に、コードを微調整していただいて、演習を続行いただければと思います!
コンサル

「LEAN ANALYTICS スタートアップのためのデータ解析と活用法」を読んで得た学び

今回の記事ではスタートアップ必見の1冊「LEAN ANALYTICS スタートアップのためのデータ解析と活用法」を読んで、本書の全体を通してのメッセージを概観した後に、私が本書から得た学びについてまとめていきたいと思います。 私のように企業内でデータを活用した意思決定の高速化を行いたいと考えている方や、スモールビジネスを始めているもののどのような指標を見ればビジネスが健全に回っているのか分からない、というお悩みを抱えた方におすすめの1冊です! ぜひ本レビューを読んで、本書のイメージを固めていただけると幸いです!