拡散モデル(Diffusion Model)
Diffusion Model
ノイズから徐々に画像を復元するように学習する画像生成手法。Stable Diffusion・DALL-E など主要画像生成AIの基盤。
拡散モデルとは
拡散モデル(Diffusion Model)は、ノイズだらけの画像から徐々にノイズを取り除いて、意味のある画像を生成する仕組みで学習される画像生成AIの手法です。
概念的には、次の2段階を学習します。
- 拡散: 学習用の画像に徐々にノイズを加え、真っ白なノイズ画像に壊していく
- 逆拡散: その逆方向を学習し、ノイズから本来の画像を復元する
この「逆拡散」の力を使うと、ランダムなノイズから指示文に合った画像を生成できるようになります。
画像生成AIとの関係
現在主流の画像生成AIのほとんどが、この拡散モデルをベースにしています。
- Stable Diffusion: オープンな拡散モデル
- DALL-E: OpenAIの拡散モデル
- Midjourney: 非公開だが拡散モデル系
GANやVAEなど他の生成モデルもありますが、高品質・多様性・制御性の観点で拡散モデルが現在の主役です。
位置づけ
士業事務所で直接このモデルを触ることはまずありません。ただ、画像生成AIを業務で使うなら裏側の仕組みとして名前だけ押さえておくと、サービス選定や著作権の議論で役に立ちます。
