見出し画像

深層学習(Deep Learning)の動物園

深層学習(Deep Learning) というのは、中間層(Hidden Layer)を積み重ねたニューラルネットを使った学習であることが代表的な説明ですが、ニューラルネットは、学習したい目的、データやタスクに応じて、様々なネットワーク構造をとり、学習効果や性能を高めようとします。

CNNは、画像認識に適用事例が多く、
RNNは、データの抽象的な流れを認識できるので動画に向いていて、
RNNの拡張であるLSTMは、長期の文脈を考慮できるので特に音声認識や機械翻訳に向いている、

等です。画像生成で話題のGAN 等もありますね、ということなのですが、どれぐらいネットワーク構造の種類があるのかを見るのに、以下のサイトが便利です。

2016年からあって、今年もアップデートされています。ジェフリー・ヒントン先生のCapsule Networkもあります。


ちなみに、BiLSTM の説明は文中にあるのですが、BERT、Back Translation と並ぶ 、BiLSTM を積み重ねた「ELMo (文脈を考慮した Representation モデル)」、そしてGPT-3も、言及される、かもしれません。


また、以下の記事は、代表的なニューラルネットの解説および初出の文献の紹介をして、横断的に調べたい、勉強したい時に向いています。


おまけ

以下は、AI関連記事一覧です。こちらもご覧ください。


この記事が気に入ったらサポートをしてみませんか?