Python

NLP

PII-Detectionコンペにおけるビタビアルゴリズムの実装を図解してみた

今回の記事では、KaggleのThe Learning Agency Lab - PII Data Detectionコンペにおいて、ビタビアルゴリズムを実装してみた時のロジックを、図解しながら解説していきたいと思います。 大規模言語モデル入門の第6章の内容を参考にしながら実装しましたが、ところどころ理解が及ばない部分があり、コンペに一緒に参加した仲間に説明できなかったことが動機となって、今回このような解説記事を書いた次第です。 できる限り分かりやすく解説していきますが、分かりずらい箇所があった場合にはコメント等をいただければ追加説明等を付与いたしますので、お気軽にコメントいただけると幸いです。
Python

fastaiライブラリの協調フィルタリングを使って、君の名は。に類似のアニメを求めてみた

この記事では、Practical Deep Learning for Codersの第7章で学んだ協調フィルタリングの内容を参考に類似のアニメを出力するレコメンドエンジンを作成してみたので、実装のコードを紹介いたします! fastaiライブラリを使えば、比較的簡単に協調フィルタリングを実装することができるので、興味を持った方はぜひご自身でも類似のデータセットを使って実装してみてください!
NLP

openai.error import OpenAIErrorを実行したらModuleNotFoundErrorが出てしまった時の対処法

この記事では、openai.error import OpenAIErrorを実行した時にModuleNotFoundErrorが出てしまった時の対処法をご紹介いたします! 大規模言語モデル入門を読み進めている方は、普通に進めてしまうと引っかかってしまうエラーなので、ぜひ本記事を参考にエラーを解消していただけると幸いです!
NLP

openai.ChatCompletion.create()を実行して、APIRemovedInV1エラーが発生した時の対処法

今回の記事では、openai.ChatCompletion.create()を実行して、APIRemovedInV1エラーが発生した時の対処法について解説していきたいと思います。 私は「大規模言語モデル入門」のコードを実行している際にこのエラーが発生してしまったので、同じようなエラーに直面してしまった方に届くと幸いです!
Python

「データ可視化学入門」を読んでみて得た学び・これから実践したいこと

この記事では「指標・特徴量の設計から始めるデータ可視化学入門 データを洞察につなげる技術」を読んでみて、データサイエンティストの自身にとって学びになったこと・これから実践していきたいことについて記事を通して共有していきたいと思います。 本書はデータサイエンティスト・データアナリストに限らず、なんらかの形でデータを可視化して意思決定をする方・意思決定する人のサポートをする方にも、データの可視化から何を読み取るべきか・データを可視化する時の注意点は何か・目的に対してどのような可視化の手段が考えられるのかを学べる良書かと思います! ぜひ本記事を見て、本書購入の際の参考にして見てください!
Python

hmm.GaussianHMMを実行したら、「AttributeError: module ‘hmmlearn’ has no attribute ‘GaussianHMM’」が出てしまった時の対処法

この記事では、時系列データにクラスタリングを適用する目的でHMMを使用した時に、AttributeErrorが出てしまった時の対処法をお教えいたします! データ可視化学入門のコードを実行している最中に出てきてしまったエラーなので、少しびっくりしたのですが、落ち着いて対処すれば解決可能です! 本記事を参考に、コードを微調整していただいて、演習を続行いただければと思います!
Python

umap.UMAPを実行したら、「AttributeError: module ‘umap’ has no attribute ‘UMAP’」が出た時の対処法

今回の記事では、次元削減手法のUMAPをPythonで実行しようとしたらAttributeErrorが出てしまった時の対処法をお教えいたします! データ可視化学入門のコードを実行している最中に出てきてしまったエラーなので、少しびっくりしたのですが、落ち着いて対処すれば解決可能です! 本記事を参考に、コードを微調整していただいて、演習を続行していただければと思います!
NLP

無料で学べる!Practical Deep Learning for Codersの第1章を受講して変わったこと・これから実行したいこと

今回の記事では、Practical Deep Learning for Codersという英語で学べるDeep Learning講座の第1章の感想を共有しながら、受講前と受講後で考え方が変わった点や、この講座のどのような点がおすすめかについてまとめていきたいと思います! この講座は全文英語で展開されるものの、そのハードルさえ乗り越えてしまえば、図表やコードを使用して、数学が苦手な人でもディープラーニングについて理解できるようになるハイパー優れた無料講座なので、本記事を読んで興味を持った方はぜひ講義を受けてみることをおすすめいたします!
Python

ChatGPT初心者おすすめ本「面倒なことはChatGPTにやらせよう」を読んでみて

今回の記事では、ChatGPTのハウツー本や大規模言語モデルの本などを5冊ほど読んできた私が、ChatGPT初学者におすすめな「面倒なことはChatGPTにやらせよう」を読んでみて認識が変わってことについて述べていきたいと思います! 正直、本書は「自身がデータサイエンスやChatGPTについてどれだけ知っているか」でおすすめ度合いが変わってきますので、本書購入前にぜひ一読いただけると幸いです!
NLP

大規模言語モデル入門でJGLUEのMARC-jaを使おうと思ったら、「RuntimeError: The Amazon Review Dataset is currently no longer public.」と出てしまったあなたへ

回の記事では、大規模言語モデル入門の第5章 大規模言語モデルのファインチューニングにて、HuggingFaceのDatasetsからJGLUEのMARC-jaデータセットをダウンロードしようとしたら、 RuntimeError: The Amazon Review Dataset is currently no longer public. と出てしまった時の対処法を紹介します!