「ゼロから作るディープラーニング2」を読んで
ゼロから作るDeep Learning ? ―自然言語処理編
- 作者: 斎藤康毅
- 出版社/メーカー: オライリージャパン
- 発売日: 2018/07/21
- メディア: 単行本(ソフトカバー)
- この商品を含むブログ (3件) を見る
なかなか読む時間がなくて、読み通すのに2か月もかかってしまいましたが、
読了したので感想などを書いてみたいと思います。
本書は「ゼロから作るディープラーニング」の続編と言うことで、RNN が
中心的な話題となっています。
当初簡単に前著の復習をした後、RNN (および Attension) を徐々に導入していきます。
最初、ナイーブな簡単なモデルが示され、そのモデルの問題点を解決する
ためにどのような改良がなされていったのか、順を追って理解できるように
工夫されています。
使っている数学や概念は前著からそれほど変わっているわけではないので、
前作が読みこなせれば、本作もすらすら読めると思います。
word2vec や seq2seq は特に詳細に記述されているため、「名前は
聞いたことがあるけど、それって何?」と思う私のような輩には
非常に役に立ちました。
多くの概念を入れ込むためと思われますが、前著と比較して、議論のスピードが
上がっているように感じます。特にコードは本文ではフラグメントしか
示されないため、Github からのソースコードダウンロードは実装を理解するために
必須です。