機械学習

Python

「自然科学の統計学」第8章演習問題1-線形確率モデルとの比較をPythonで解いてみた

今回の記事では、統計学の青本「自然科学の統計学」の第8章-演習問題1「線形確率モデルとの比較」をPythonで解いていきたいと思います。 今回の問題は非常にシンプルな単回帰モデルの構築なので、かなり理解いただきやすいかと思われます。
Kaggle

優秀なデータサイエンティストの同僚とKaggleのPII-Detectionコンペに挑戦してみて得た学びとこれから実践したいこと

今回の記事では、初心者Kagglerの私が所属企業の優秀なデータサイエンティストのメンバーとKaggleのPII-Detectionコンペに挑戦してみて得た学びとこれから実践していきたいことについてまとめてみたいと思います。 私は今回初めてチームを組んでKaggleに取り組みましたが、1人で取り組んでいた時には見えなかった、他のデータサイエンティストがどのようにしてKaggleを進めているのかについて知ることができたのでそれについてまとめていきたいと思います。 一方で、私はチームでなかなかバリューを出せなかったので、「なぜバリューが出せなかったのか」「今後どうすればチームでKaggleを行った時にバリューを出せるようになるのか」について考えていきたいと思います。
NLP

LLMの教科書「大規模言語モデル入門」を読んで私が得た学び

今回の記事では、LLMにおける教科書的1冊「大規模言語モデル入門」を読んでみて、私が得た学びについてまとめていきたいと思います。 本書は、「LLMを今まで触ったことがないけど、LLMの実装やLLMで何ができるのか知りたい」「Transformerモデルについて理解を深めたい」という方必読の1冊となっております。 本書評を見て、「大規模言語モデル入門」からどのような学びが得られるのかについて解像度を上げていただけると幸いです!
NLP

PII-Detectionコンペにおけるビタビアルゴリズムの実装を図解してみた

今回の記事では、KaggleのThe Learning Agency Lab - PII Data Detectionコンペにおいて、ビタビアルゴリズムを実装してみた時のロジックを、図解しながら解説していきたいと思います。 大規模言語モデル入門の第6章の内容を参考にしながら実装しましたが、ところどころ理解が及ばない部分があり、コンペに一緒に参加した仲間に説明できなかったことが動機となって、今回このような解説記事を書いた次第です。 できる限り分かりやすく解説していきますが、分かりずらい箇所があった場合にはコメント等をいただければ追加説明等を付与いたしますので、お気軽にコメントいただけると幸いです。
Python

fastaiライブラリの協調フィルタリングを使って、君の名は。に類似のアニメを求めてみた

この記事では、Practical Deep Learning for Codersの第7章で学んだ協調フィルタリングの内容を参考に類似のアニメを出力するレコメンドエンジンを作成してみたので、実装のコードを紹介いたします! fastaiライブラリを使えば、比較的簡単に協調フィルタリングを実装することができるので、興味を持った方はぜひご自身でも類似のデータセットを使って実装してみてください!
NLP

openai.error import OpenAIErrorを実行したらModuleNotFoundErrorが出てしまった時の対処法

この記事では、openai.error import OpenAIErrorを実行した時にModuleNotFoundErrorが出てしまった時の対処法をご紹介いたします! 大規模言語モデル入門を読み進めている方は、普通に進めてしまうと引っかかってしまうエラーなので、ぜひ本記事を参考にエラーを解消していただけると幸いです!
NLP

openai.ChatCompletion.create()を実行して、APIRemovedInV1エラーが発生した時の対処法

今回の記事では、openai.ChatCompletion.create()を実行して、APIRemovedInV1エラーが発生した時の対処法について解説していきたいと思います。 私は「大規模言語モデル入門」のコードを実行している際にこのエラーが発生してしまったので、同じようなエラーに直面してしまった方に届くと幸いです!
Python

「データ可視化学入門」を読んでみて得た学び・これから実践したいこと

この記事では「指標・特徴量の設計から始めるデータ可視化学入門 データを洞察につなげる技術」を読んでみて、データサイエンティストの自身にとって学びになったこと・これから実践していきたいことについて記事を通して共有していきたいと思います。 本書はデータサイエンティスト・データアナリストに限らず、なんらかの形でデータを可視化して意思決定をする方・意思決定する人のサポートをする方にも、データの可視化から何を読み取るべきか・データを可視化する時の注意点は何か・目的に対してどのような可視化の手段が考えられるのかを学べる良書かと思います! ぜひ本記事を見て、本書購入の際の参考にして見てください!
Python

hmm.GaussianHMMを実行したら、「AttributeError: module ‘hmmlearn’ has no attribute ‘GaussianHMM’」が出てしまった時の対処法

この記事では、時系列データにクラスタリングを適用する目的でHMMを使用した時に、AttributeErrorが出てしまった時の対処法をお教えいたします! データ可視化学入門のコードを実行している最中に出てきてしまったエラーなので、少しびっくりしたのですが、落ち着いて対処すれば解決可能です! 本記事を参考に、コードを微調整していただいて、演習を続行いただければと思います!
Python

umap.UMAPを実行したら、「AttributeError: module ‘umap’ has no attribute ‘UMAP’」が出た時の対処法

今回の記事では、次元削減手法のUMAPをPythonで実行しようとしたらAttributeErrorが出てしまった時の対処法をお教えいたします! データ可視化学入門のコードを実行している最中に出てきてしまったエラーなので、少しびっくりしたのですが、落ち着いて対処すれば解決可能です! 本記事を参考に、コードを微調整していただいて、演習を続行していただければと思います!