転置畳み込み（Transposed Convolution）とは

2023年11月4日 17:31

本記事では、畳み込み（Convolution）は知っているけど、転置畳み込み（Transposed Convolution）は知らないという方のための解説をします。

画像生成と画像拡大

ニューラルネットワークを使用して画像を生成するには、通常、低解像度から高解像度への画像の拡大（Upsampling、アップサンプリング）が必要になります。

アップサンプリング操作を実行するにはさまざまな方法があります。

これらすべての方法は、なんらかの補間手法（Interpolation Method）が使われます。補間は画像における画素間の値を計算し画像を拡大することを可能にします。

よって画像生成などのモデルのネットワークアーキテクチャを決定する際にどのような補間手法を使うのか選択する必要があります。

上記の補間手法はどれも、あらかじめ決められたアルゴリズムを使います。それは、人間が考えた特徴量エンジニアリングのようなもので、ネットワーク自体が学習するものではありません。

しかし、対象とする画像によっては異なる手法、あるいはより複雑なマッピングが必要となる可能性があります。それなら、モデル自体が最適なアップサンプリング方法を学習すること望ましいと考えられます。

そこで転置畳み込みが登場します。

3,620字 / 11画像

¥1,000 / 月

初月無料

人工知能、機械学習、ディープラーニング関連の用語説明、研究論文の概要、プログラミングの具体例などの読み応えのある新しい記事が月に４−５本ほど追加されます。また、気になるAIニュースや日常の雑観などは随時公開しています。

この記事が気に入ったらサポートをしてみませんか？