これほどまでに期待を裏切らない続編はない！書籍『ゼロから作るDeep Learning ❷ ―自然言語処理編』から得た学び3選

元教師

こんにちは！データサイエンティストの青木和也（https://twitter.com/kaizen_oni）です！

本記事では、ゼロつくシリーズ第2弾、書籍『ゼロから作るDeep Learning ❷ ―自然言語処理編』を読んで得た学びを厳選して3つご紹介いたします。

前作の『ゼロから作るDeep Learning ―Pythonで学ぶディープラーニングの理論と実装』もゼロから作っているにも関わらず、非常に分かりやすかったのですが、本作も全くもって期待を裏切らない完成度で、ニッコニコで自然言語処理の裏側の仕組みについて理解を深めることができました。

本書は、もはやブームにもなっている生成AIの根底にある仕組みについて理解を深めたい方や、初心者機械学習エンジニアの方にお勧めです！

本書の概要
本書から得たい学び
[本書読了後] 私が本書から得た学び
まとめ

本書の概要

本作では、自然言語処理や時系列データ処理に焦点を当て、ディープラーニングを使ってさまざまな問題に挑みます。
そして、前作同様「ゼロから作る」をコンセプトに、ディープラーニングに関する高度な技術をじっくりと堪能していきます。
斎藤康毅『ゼロから作るDeepLearning2 自然言語処理編』（オライリー・ジャパン/2018）Piii

本書は、前作の『ゼロから作るDeep Learning ―Pythonで学ぶディープラーニングの理論と実装』の続編となる通称ゼロつくシリーズの第2弾の書籍となっており、自然言語処理に関するトピックについて、読者自ら「ゼロから」実装していく本となっています。

世に自然言語処理に関する書籍は多々あれど、「ゼロから実装」しながらも「非常に分かりやすい」というバランスを保っている書籍は本書以外にないのではないでしょうか。

それほどまでに分かりやすい書籍となっているため、ディープラーニング初学者にもおすすめできる1冊です。

本書の章立ては以下のようになっています。

第1章ニューラルネットワークの復習
第2章自然言語と単語の分散表現
第3章 word2vec
第4章 word2vecの高速化
第5章リカレントニューラルネットワーク（RNN）
第6章ゲート付きRNN
第7章 RNNによる文章生成
第8章 Attention

本書の章立てをご覧になってもわかるように、自然言語処理というものがどのような歴史を辿ってきたか、当時の人がどのような課題感を持って次なるアルゴリズムを生み出したのかが体験できるような流れになっています。

本書から得たい学び

私が本書から得たい学びは以下の3つです。

自然言語処理において誤差逆伝播はどのように利用されているのか
RNN/LSTMの実装
Attentionの実装

昨今はTransformerモデルを使って簡単にファインチューニングや推論を行うことができるようになりました。

だからこそ、RNN、LSTM、Transformerの中身の部分について知らないままにそれらを利用している方も多いのではないでしょうか？

そのようなある種のパッケージ化されている部分について、本書を読み、1から作ることで理解を深めたいと考えています。

[本書読了後] 私が本書から得た学び

私が本書から得た学びは以下の3つです。

自然言語処理におけるアルゴリズムの変遷
RNNが長期記憶を持てず、LSTMが長期記憶をそこそこ保持できるわけ
Transformerが並列処理できるわけ

順を追って解説していきます。

自然言語処理におけるアルゴリズムの変遷

近年の自然言語処理においては完全にTransformerが主流も主流ですが、本書においては「人間がコンピューター用に辞書を作って、それを元に言語を解析する」という自然言語の原初のところから手を動かして学びことができます。

つまり、以下のような自然言語の変遷を学ぶことができるのです

シソーラスによる手法: 類義語をまとめた辞書のようなものを作り、コンピューターに単語間の関連性を教える
カウントベース: 「単語の意味は、周囲の単語によって形成される」という仮説に基づき、ある単語の周囲の単語の数を数えて行列で表現し、その行列から言葉の類似度を導く
word2vecのCBOWモデル: 隣にあるトークン（$\risingdotseq$単語）をディープラーニングで推論することで単語の意味を抽出したベクトルに変換する
RNN: 前の文脈を加味して次の単語を予測することで、文脈を考慮した単語の意味を抽出する
LSTM: RNNに「記憶」を保持/削除する機能を追加し、より長い文脈を考慮できるように改良
Transformer: 単語のどこを注視すべきかという情報を付与するAttentionレイヤを導入することによって、言語理解の性能アップと並列計算を実現

上記自然言語処理の変遷は、すべて本書の中で実際に自分で一からコードを書いて、処理の内容を体験することができます。

もちろん、「ライブラリを使って時短！」などのようなことはしません。

全てを己が手で作りながら学んでいくのです。

現代においてはTransformerが当たり前となってしまいましたが、そこに至るまでにどのような試行錯誤をかつてのAI研究者たちが重ねてきたのか、その一端を垣間見ることができました。