IDEA AND CREATIVITY
クリエイティブの専門メディア

           

xR時代のテクニカルディレクション

画像生成AIの隆盛をもたらした技術

岡田太一

xRやメタバースなどへの注目が高まる中、広告領域でも新たなテクノロジー活用の可能性が広がっている。CGなどによるリアルタイム表現のR&Dに多数取り組んできた岡田太一さんが解説する。

画像生成AI「Stable Diffusion」上で開発中、筆者の会社のモデルによる作例。

画像生成AIの隆盛をもたらした技術

世の中ではChatGPTをはじめとした大規模言語モデルが大盛り上がりですが、マイペースに画像生成AIの話を続けたいと思います。最近の画像生成AIはその出自として、アップスケーリング(超解像)やスタイル変換から発展してきたといえます。

アップスケーリングは、低解像度の画像を高解像度に変換し、画像品質を向上させる技術です。一方、スタイル変換は、別の画像のスタイルに基づいて入力画像のスタイルを変更する技術です。アップスケールやスタイル変換はタスクとして大変わかりやすく、Photoshopなどの商用プロダクトでも盛んに導入されてきました。

こうした技術を実現するにあたり、GAN(敵対的生成ネットワーク)や、VAE(変分オートエンコーダ)といった技術が利用されました。GANは、生成器(Generator)と識別器(Discriminator)という2つのニューラルネットワークを競争させて学習させ、高品質なデータ生成を実現する技術です。生成器はノイズからデータを生成し、識別器はそれが本物か偽物かを判断します。この相互学習プロセスにより、生成器は徐々に本物(正解)に近いデータを生成するように進化します。GANは一定の解像度までは高品質な出力を実現し、これまでの生成モデルの主流でした。

VAEはエンコーダとデコーダの2つの部分から...

あと60%

この記事は有料会員限定です。購読お申込みで続きをお読みいただけます。

お得なセットプランへの申込みはこちら

xR時代のテクニカルディレクション の記事一覧

画像生成AIの隆盛をもたらした技術(この記事です)
画像生成AIの流行がもたらすもの
バーチャルプロダクションはコストダウンのための手段ではない
バーチャルプロダクションのバズワード化
「バーチャルプロダクション」とは何?
なぜxRの「x」は小文字なのか
ブレーンTopへ戻る