Python

APPROACHING (ALMOST) ANY MACHINE LEARNING PROBLEMのコードエラー修正備忘録

この記事では、「APROACHING (ALMOST) ANY MACHINE LEARNING PROBLEM」のコード部分で、Pythonや他ライブラリの仕様変更に伴ってコードが上手くいかない部分について、2024/1/17現在のバージョンに基づいたコードの修正版を掲載していきたいと思います。 私自身もコードが上手くいかずになんでだろう?と苦戦したところなので、他にも同書籍を学習中の方の一助になれば幸いです!
BigQuery

SAPからGCPのBigQueryにバイナリ型のデータを送る時にデータが変換されてしまう原因を調査してみた

今回の記事では、SAPからBigQueryにETLツールを使ってデータ連携をする際に「なんでバイナリ型のデータがGCPに入れたら勝手に変換されてるん???」ということが起きたので、その事象の仕組みについて、僕なりに調べて結果を解説していきます。 バイナリデータに触れたのが初めてで苦戦したので、同じような疑問にぶち当たった人に届けばいいなと思っております!
統計基礎

統計学の超基本!相関係数について統計検定3級類似問題/Python/R/SQLの演習付きで分かりやすく解説!

今回の記事では、統計学の基本の「き」、相関係数について解説していきたいと思います! 相関係数は身長と体重など、データ間の関係性を読み解くのに非常に重要な指標です。 一方で、世の中では「相関」について誤った認識が出回ってしまっている印象があります。 まずは本記事で相関係数を定義からしっかり叩き込みましょう!
統計基礎

統計学の超基本!分散・標準偏差について統計検定3級類似問題/Python/R/SQLの演習付きで分かりやすく解説!

今回の記事では、統計学の基本の「き」、分散と標準偏差について解説していきたいと思います! 分散と標準偏差は平均値や中央値、最頻値だけでは表すことができないデータの散らばり具合を表す重要な指標です。 ぜひ本記事で分散と標準偏差の定義やその意味について理解していってください!
統計基礎

統計学の超基本!中央値について統計検定3級類似問題/Python/R/SQLの演習付きで分かりやすく解説!

今回は統計学の基本の「き」、平均値と並んで利用される値、中央値について解説していきたいと思います! 中央値は平均値の影に隠れていながらも、平均値ではカバーできない領域をカバーしている優秀な脇役なのです。 ぜひ中央値についてマスターして、データの分布によって代表値を使い分けられる人になっちゃってください!
統計基礎

統計学の超基本!平均値について統計検定3級類似問題/Python/R/SQLの演習付きで分かりやすく解説!

今回は統計学における基本の「き」、平均値について解説していきたいと思います。 平均値はデータ全体の特徴を捉えるのに有用な指標の一つです。 ぜひ平均値についてマスターして、データを扱った意思決定の第1歩を踏み出しましょう!