【Stable Diffusion】ステーブル・ディフュージョンとは【画像生成AI】

1Stable Diffusion(ステーブル・ディフュージョン)とは、テキストから画像を生成するための機械学習モデルです。

 

テキストで指示するだけで、AIが画像を生成してくれます。

 

非常に軽いのが特徴。

 

また無料で使えるオープンソース。

 

「Stability AI」というイギリス企業が2022年8月に開発。

 

自然言語で記述されたプロンプトに基づいて画像を生成することができます。

 

では早速、Stable Diffusionで画像を生成してみます。

 

Stable Diffusionを使用出来るサイトやサービスは色々ありましたが、すぐに閉鎖してしまいます。

 

画像生成AIはどうしても著作権の問題がつきまとうので維持が難しいようです。

 

ですので、今回はpythonで簡単に使ってみます。

 

 

●PythonでStable Diffusionを使う

 

PythonでStable Diffusionを使用するには、まず必要なライブラリをインストールします。

 

py -m pip install diffusers

py -m pip install torch

py -m pip install transformers

 

次に、以下のコードを実行して画像を生成します。

生成させる画像は「猫」にします。

日本語より英語の方が理解してくれるので「cat」と入力します。

 

from diffusers import StableDiffusionPipeline

import torch

device = "cuda" if torch.cuda.is_available() else "cpu"

pipe = StableDiffusionPipeline.from_pretrained("runwayml/stable-diffusion-v1-5", torch_dtype=torch.float32)

pipe = pipe.to(device)

image = pipe(

prompt="cat",

negative_prompt="blurry, low quality, distorted",

num_inference_steps=30,

guidance_scale=7.5,

).images[0]

image.save("output.png")

 

このコードでは、Stable Diffusionのパイプラインを作成し、指定したプロンプトに基づいて画像を生成しています。

生成された画像は、`image`変数に保存されます。

必要に応じて、画像を保存したり表示したりすることができます。

 

# 画像を保存する例

image.save(“output.png”)

 

# 画像を表示する例

image.show()

 

※画像生成には環境にもよりますが、5分~10分ほどかかりますので気長に待ってね。

 

●コードの説明

 

– `from diffusers import StableDiffusionPipeline`:

Stable Diffusionのパイプラインをインポートします。

 

– `import torch`:

PyTorchをインポートします。

 

– `device = “cuda” if torch.cuda.is_available() else “cpu”`:

GPUが利用可能な場合はCUDAを使用し、そうでない場合はCPUを使用します。

 

– `pipe = StableDiffusionPipeline.from_pretrained(“runwayml/stable-diffusion-v1-5”, torch_dtype=torch.float32)`:

Stable Diffusionのモデルをロードします。

 

– `image = pipe(…)`:

指定したプロンプトに基づいて画像を生成します。

 

– `negative_prompt`:

生成したくない要素をテキストで指定します。

 

– `num_inference_steps`:

画像生成のステップ数を指定します。多いほど高品質な画像が生成されますが、時間もかかります。

 

– `guidance_scale`:

生成される画像の品質を制御するためのスケール値を指定します。高い値ほどプロンプトに忠実な画像が生成されます。

 

– `image.save(“output.png”)`:

生成された画像をファイルに保存します。

 

以上が、Stable Diffusionを使用して画像を生成する簡単な方法です。

プロンプトや生成のパラメータを調整することで、さまざまなスタイルや内容の画像を生成することができちゃいます!

しかも無料で!!

画像生成のサービスは色々ありますが、2026年5月の状況だとほとんどが有料になっています。

なので、無料で使えるStable Diffusionはとてもありがたひ。

 

【まとめ】

Stable Diffusionは、テキストから画像を生成出来る無料のオープンソース。

Pythonで簡単に使用できます。

コメント