CNN(畳み込みニューラルネット)
Convolutional Neural Network
畳み込み層を持つニューラルネット。画像認識の分野で広く採用され、現代の画像系AIの基礎技術のひとつ。
CNN(畳み込みニューラルネット)とは
CNN(Convolutional Neural Network)は、畳み込み層と呼ばれる仕組みを持つニューラルネットワークです。画像認識の分野で広く採用され、現代の画像系AIの基礎のひとつになっています。
ディープラーニングブームを牽引した代表的なモデル構造で、画像分類・物体検出・顔認識など多くの応用を支えてきました。
仕組み
- 畳み込み層: 画像の一部(小さな窓)を少しずつずらしながらスキャンし、エッジ・角・模様などの特徴を自動で抽出する
- プーリング層: 重要な情報を残しつつ、データサイズを縮める
- 全結合層: 抽出した特徴をもとに最終的な分類・予測を行う
この構造により、画像の位置ずれや変形に強い認識が可能になります。人間が「特徴はこれ」と決めなくても、モデル自身が有用な特徴を学習するのが大きな特徴です。
応用
- 画像分類: 写真が何か判定
- 物体検出: 画像内のどこに何があるかを特定
- 顔認識・文字認識(OCR)
- 医療画像解析: X線・MRIの異常検出
他との違い
- RNN: 時系列や文章など、順序のあるデータに強い
- CNN: 画像など、空間的なパターンに強い
近年はTransformer系モデル(Vision Transformer等)も画像分野に進出していますが、CNNは今も広く使われている基盤技術です。AI-OCRや画像系の業務AI製品の裏側では、多くがCNNベースで動いています。
