Stable Diffusionでの画像生成における、画像サイズと生成時間の関係を調査しました。
modelはchilloutmix_NiPrunedFp32Fix.safetensors
GPUはRTX2080(VRAM8GB)です。
![](https://mountainnavi.com/wp-content/uploads/2023/10/image-1-3.webp)
出力する画像サイズを変化させていった時の画像生成完了までの時間(秒)を計測しました。
サイズが小さい(500×500)と今回使ったモデルでは、顔がぐちゃぐちゃになっていることが多く、絵の質が悪いと感じました。
600×600から急激に絵の質の向上が感じられ充分実用的なレベルに達していると感じましたが、部分的に少しピントがぼけるような絵もいくつか見られていました。
1000×1000にした時は一番、絵の質や画質なども最高なものが得られていると感じました。
1000×1000以上にしても、時間が長くなるだけで質に変化は感じませんでした。
以上から、今回の実験モデルでは、1000×1000が最適条件と考えられました。
ただ、1枚生成するのに20秒かかるのは少しストレスを感じます。
もっと快適に画像生成を楽しむにはVRAMが12GBくらい必要と思われます。
最近はGPU価格も落ち着いてきて、RTX3060(VRAM 12GB)が4万円前後で購入できるようになったのでおすすめです。