Stable Diffusion

RTX2080からRTX3090に変更して画像生成してみた【Stable Diffusion】

2023年9月15日

GPUをRTX2080(VRAM 8GB)からRTX3090(VRAM 24GB)に換装して、Stable Diffusionによる画像生成を行ってみましたのでご紹介します。

画像生成におけるVRAM容量の重要性

画像生成AIの動作を、大きなパズルの作成に例えてみましょう。

このパズルを完成させるためには、多数のピースを同時に配置し、正しい位置関係を見極めながら組み立てる必要があります。GPUメモリは、これらのパズルのピースを一時的に置く「テーブル」のようなものです。

大きなパズルや複雑な画像を作る場合、より広い「テーブル」(すなわち多くのGPUメモリ)が必要です。GPUメモリが少ないと、パズルのピースを一度にすべて配置できず、効率的に組み立てることが難しくなります。逆に、GPUメモリが豊富にあれば、多くのピースを同時に扱い、迅速にパズルを完成させることができます。

つまり、画像生成AIにおけるGPUメモリの多さは、AIがより高品質で複雑な画像を迅速に生成する能力を向上させるキーとなる要素です。

RTX 3090に換装

今まで、RTX2080を使っていたんですが、3090は圧倒的にデカイです。

フルタワーケースじゃないと入らないかもしれないですね。

RTX2080とRTX3090の画像生成時間の比較

Stable Diffusinの設定は同じで、グラフィックボードだけを変えて、画像の出力にかかる時間を測定しました。

画像サイズが400×400px以下では、顔がぐちゃぐちゃになった絵が多くなり質はかなり落ちていました。
また、1000×1000pxを超えると、人物が増える傾向が強まり、上半身だけの人物が出る割合も増加しました。使っているモデルがどういうものかによって、最適な出力サイズがあるように思いました。

今回使用したモデルでは、どちらのグラボでも600~800pxが最も良くプロンプトを反映した結果になったように感じました。

800×800pxで快適に出力するとなると、VRAM 8GBでは少し遅いので12GBくらいがおすすめです。

おすすめグラボ

StableDiffusionに必要なGPU等のスペックに関して、開発元Stability.AIでは明確な記載はしていません。

しかし、StableDiffusionを動かすうえではNvidia製のGPUが推奨されています。

既にご存じとは思いますがGPUには、AMD製のRadeonなどもあります。

Radeonは、StableDiffusionとの相性が悪く、画像生成速度がかなり遅いそうなので、Stable Diffusionを主な使用目的の場合には間違って買わないよう気を付けてください。

一度に多くの画像の生成や解像度を上げて出力できるためビデオメモリ(VRAM)の容量が多い程、画像生成には有利です。

VRAM8GBのRTX2080を以前使っていたのですが、画像生成は少し遅く感じましたので、VRAM12GBくらいが最適だと思います。

自分でLoRAを作成する場合には、画像生成よりも多くのVRAMを使用しますので、そのような場合にはもっとたくさんのVRAM容量があると快適だと思います。

[商品価格に関しましては、リンクが作成された時点と現時点で情報が変更されている場合がございます。]

GG-RTX3060-E12GB/OC/DF GALAKURO GAMING
価格:39,970円(税込、送料別) (2024/1/9時点)



Stable Diffusion

2024/2/25

Stable Diffusion Upscalerを使いこなそう!初心者向けの簡単スタートアップガイド

画像品質は、デジタル時代におけるコンテンツの鍵となる要素です。特にAIによって生成される画像は、その鮮明さとディテールが求められます。しかし、多くのAI生成技術、特にStable Diffusionは、標準的な解像度では限界があります。ここでAIアップスケーラーの役割が重要になります。この先進的なツールは、低解像度の画像を高品質の作品へと変換する力を持っています。 本記事では、AIアップスケーラーの必要性、機能、そしてその使用方法について詳しく説明します。また、ESRGANのようなAIアップスケーラーがど ...

ReadMore

Stable Diffusion

2024/2/24

CFGスケールとは何か? - 初心者向けに解説するStable Diffusionの基本

CFGスケール(Classifier Free Guidance Scale)は、近年話題のStable Diffusionという画像生成モデルにおいて重要な概念です。このスケールは、生成される画像がどの程度入力されたプロンプトや画像に忠実になるかを決定するパラメータです。しかし、このCFGスケールをどのように理解し、最適に使用するかは初心者にとって少々難しいかもしれません。本記事では、CFGスケールの基本的な役割とそれを最適に調整する方法について、初心者でも理解しやすいように丁寧に解説していきます。 C ...

ReadMore

Stable Diffusion

2024/1/17

Clip Skipのマスターガイド: Stable Diffusionでの画像生成の最適化

Clip Skipとは Clip Skipは、Stable Diffusion(1.xモデル)のテキスト埋め込み層であるCLIPモデル(1.xモデルに存在)の一部のレイヤー(層)を生成過程でスキップする機能です。これにより、画像のレンダリングも速くなり、ユニークで素早く生成される画像が得られます。Stable DiffusionのCLIPモデルは異なる情報を含む12の層から構成されており、各層は前の層よりも具体的な情報を持っています。そして、プロンプトの基本的な理解からより具体的な詳細まで、生成される画像 ...

ReadMore

Stable Diffusion

2024/1/15

【Stable Diffusion】画像をプロンプトとして使うIP-Adapterの活用ガイド

IP-Adapterとは何か IP-Adapterは、イメージプロンプトアダプターの略で、コントロールネットの新しいモデルです。従来のテキストベースのプロンプトに代わり、画像をプロンプトとして使用することで、画像生成や変更をより直感的かつ詳細に行うことができます。この技術により、クリエイティブな画像生成が可能になり、新たな表現の幅が広がります。 IP-Adapterの使い方 IP-Adapterの使用方法は比較的簡単です。まず、対応するコントロールネットをアップデートし、IP-Adapter用のモデルをダ ...

ReadMore

Stable Diffusion

2023/12/21

服装に関する参考プロンプト一覧

Stable Diffusionのプロンプトとは? Stable Diffusionプロンプトとは、画像生成AIであるStable Diffusionで画像を生成するために使用する、自然言語で記述された指示です。プロンプトは、画像の題材、構図、雰囲気など、生成したい画像の特徴を記述します。 服装のプロンプト プロンプト日本語意味DressドレスMiniskirtミニスカートMaxiskirtマキシスカートA-line skirtひざ丈のAラインスカートPencil skirtペンシルスカートSkortスカ ...

ReadMore

-Stable Diffusion