【Stable Diffusion】既存の写真から好きな画像を生成できる「img2img」を使って人物、景色、建物等をカスタマイズ!!

Kjey channel
9 May 202304:05

TLDRこの動画では、ステーブル・ディフュージョンを使ったimg2img機能を用いて、自然風景や人物、建築物などの写真を生成する方法が紹介されています。デノイジングストレングスを0.2から1まで変更し、元画像との違いを確認しながら生成された画像の変化を解説しています。ストレングスが低い場合は元画像に忠実で、高くなるとプロンプトに基づく画像が生成され、元画像から離れていきます。設定に関しては試行錯誤が必要で、適切な数値を見つけることが重要です。

Takeaways

  • 🌄 ステーブル・ディフュージョンを使って自然風景、アニメーション、人物、建物の画像を生成する方法を紹介。
  • 🔧 デノイシング・ストレングスの設定で画像の忠実度を調整可能。0.2〜1までの範囲で検証。
  • 🖼️ デノイシング・ストレングスを0.2に設定すると、生成画像は元画像に非常に近くなる。
  • 🔄 0.5の設定でも元画像の形状はほぼ維持されている。
  • 🌳 0.7に設定すると、プロンプトがより強く反映され、元画像から離れるが、中心の要素を残す場合がある。
  • 🌊 1に設定すると、生成された画像は元画像の影響をほとんど受けず、完全に別物になることがある。
  • 🏨 建物の生成では、デノイシング・ストレングスを変えることでプロンプトに忠実な変化が見られる。
  • 👤 人物画像の生成では、0.7以上で元画像と異なる結果が現れることがある。
  • 🎨 アニメ画像の生成では、デノイシング・ストレングスを変えるとタッチが変わることがある。
  • 🔍 デノイシング・ストレングスは試行錯誤が必要で、7〜8.6に設定すると良い結果が得られやすい。

Q & A

  • ステーブル・ディフュージョンでどのような画像を生成できますか?

    -ステーブル・ディフュージョンを使って、自然風景、アニメーション、人物、建築物などの写真を生成することができます。

  • デノイジング・ストレングスとは何ですか?

    -デノイジング・ストレングスは、ノイズを取り除く力を表し、値が低いほど元の画像に忠実で、値が高いほどプロンプトに従った生成が行われます。

  • デノイジング・ストレングスが0.2に設定された場合、画像はどのように生成されますか?

    -0.2に設定すると、生成された画像は元画像に非常に近い形で保持され、ほぼ原型をとどめた状態で生成されます。

  • デノイジング・ストレングスを0.7に設定するとどうなりますか?

    -0.7に設定すると、生成された画像はプロンプトに従い、元画像から少し離れた結果になります。例えば、風景では木は残りますが、他の要素がプロンプトに応じて変化します。

  • デノイジング・ストレングスを1に設定した場合の結果は?

    -デノイジング・ストレングスが1になると、元画像から大きく離れた画像が生成され、元の要素がほとんど影響を受けなくなります。

  • 建築物の画像生成では、どのような変化が見られましたか?

    -建物の画像生成では、デノイジング・ストレングスが低いと原型を保ちますが、数値を上げると、プロンプトに従って建物のデザインが大きく変化しました。

  • 人物画像の生成ではどのような変化が起こりますか?

    -人物画像の場合、デノイジング・ストレングスが低いと元画像に忠実ですが、値が上がると顔の特徴や雰囲気が変わり、完全に別の人物になることがあります。

  • アニメ画像の生成において、デノイジング・ストレングスの変化はどのように影響しますか?

    -アニメ画像の場合、デノイジング・ストレングスを上げると、元のキャラクターの特徴が変化し、全く異なる人物や背景が生成されることがあります。

  • デノイジング・ストレングスの最適な設定は何ですか?

    -経験から、デノイジング・ストレングスを7から8.6に設定すると、プロンプトに忠実な画像が生成されやすくなりますが、試行錯誤が必要です。

  • 動画を通じて学んだことを視聴者に伝える方法は?

    -動画がためになった場合は、チャンネル登録といいねをお願いし、次回の動画でまた会えることを視聴者に伝えています。

Outlines

00:00

📸 How to Generate Images Using Stable Diffusion

This section introduces the topic and purpose of the video. The speaker, KJ, explains how to use Stable Diffusion to generate images of natural landscapes, animated characters, and architecture. They will demonstrate how changes to the denoising strength (from 0.2 to 1) affect how closely the generated images align with the original prompt.

🌿 Generating Natural Landscape Images

In this part, the speaker guides viewers on how to generate images of natural landscapes. They start by setting the denoising strength to 0.2, which produces images closely resembling the original ones. As the denoising strength is increased to 0.5 and 0.7, the generated images begin to follow the prompts more, moving further from the originals, such as adding a lake and mountain to the scene. At a denoising strength of 1, the images completely diverge from the originals, with unexpected elements like an ocean appearing.

🏢 Generating Architectural Images

This section focuses on generating architectural images. With the denoising strength set to 0.2, minor changes occur, such as the hotel name disappearing due to the negative prompt text. At 0.5, the image shows a signboard that wasn’t part of the original, still maintaining much of the original design. When the strength is raised to 0.7, the architecture becomes more abstract, resembling something designed by the speaker, with more changes. Finally, at a strength of 1, the original design is almost entirely replaced with a luxurious golden building.

👥 Generating Character Images

In this part, the focus shifts to generating images of people. At a denoising strength of 0.2, there are hardly any changes to the original. When set to 0.5, there are slight atmospheric changes. By increasing the denoising strength to 0.7, the image becomes more dramatic, even resembling a murder scene. At the highest strength of 1, the character’s face transforms into an Asian-looking person.

🎨 Generating Animated Character Images

This section discusses generating images of animated characters. At a denoising strength of 0.2, there is minimal change to the original image. When the strength is increased to 0.5, there are subtle stylistic differences. With the strength set to 0.7, the character’s appearance drastically changes, and they now hold a camera. Finally, at a strength of 1, the image becomes entirely different and unrecognizable.

🔧 Optimal Denoising Strength for Image Generation

In this conclusion, the speaker shares their experience after generating many images, suggesting that a denoising strength between 0.7 and 0.86 is ideal for creating high-quality images. They encourage experimentation with settings to achieve the best results and wrap up by asking viewers to like and subscribe if they found the video helpful.

Mindmap

Keywords

💡ステーブル・ディフュージョン

ステーブル・ディフュージョンは、AI技術を使用して画像を生成するためのモデルです。このビデオでは、ステーブル・ディフュージョンを使って、風景、人物、建築物などをカスタマイズした画像を生成する方法が紹介されています。

💡img2img

img2imgは、既存の画像を基にして新たな画像を生成する機能です。このビデオでは、用意した画像を使って、元画像に基づきながらプロンプトに従った新しい画像を生成する手順が説明されています。

💡デノイシングストレングス

デノイシングストレングスは、生成された画像が元画像にどれだけ忠実かを示すパラメータです。数値が低いほど元画像に近い結果が得られ、高いほどプロンプトに従った新しい画像が生成されます。ビデオでは、この値を0.2から1まで変更し、生成結果の違いを検証しています。

💡プロンプト

プロンプトは、AIに対してどのような画像を生成するかを指示するテキストです。ビデオでは、プロンプトが元画像にどのように影響を与えるかが、特にデノイシングストレングスの値を変更した際に説明されています。

💡風景

風景画像は、自然や都市の景色を表現したものです。このビデオでは、風景画像を基にデノイシングストレングスの値を変えながら新しい風景を生成する過程が詳しく説明されています。

💡建築物

建築物は、ビルや家などの建物を指します。このビデオでは、建築物の画像を使って、デノイシングストレングスの設定による画像の変化が紹介されています。特に、プロンプトに従って建物が大きく変わる様子が見られます。

💡アニメーション人物

アニメーション人物は、アニメスタイルで描かれたキャラクターの画像です。このビデオでは、元のアニメキャラクターの画像に対してデノイシングストレングスを変えることで、どのようにキャラクターが変化するかが示されています。

💡ネガティブプロンプト

ネガティブプロンプトは、生成する際に避けたい要素を指定するプロンプトです。ビデオでは、ホテル名が消えた事例が紹介されており、これはネガティブプロンプトが影響を与えた結果とされています。

💡生成された画像

生成された画像は、AIがプロンプトや元画像に基づいて新しく作り出した画像です。ビデオでは、デノイシングストレングスの設定によって生成された画像がどのように変化するかが詳しく解説されています。

💡試行錯誤

試行錯誤は、最適な結果を得るために設定や手法を繰り返し調整するプロセスです。ビデオでは、デノイシングストレングスやプロンプトの設定を色々試しながら、理想の画像を生成するための方法が説明されています。

Highlights

img2img機能を使って写真から人物、風景、建物をカスタマイズ可能。

デノイジングストレングスの設定でプロンプトにどれだけ忠実に画像を生成できるかを調整。

デノイジングストレングス0.2で元画像にかなり忠実な結果が得られる。

デノイジングストレングス0.5でも元画像の原型を維持しつつ生成。

デノイジングストレングス0.7に設定すると、プロンプトの指示がより重視され、元画像からやや離れた結果に。

デノイジングストレングス1で元画像からかなり離れた生成結果が得られる。

風景の生成では、プロンプトによって湖や山が描かれることが確認された。

建物の生成では、デノイジングストレングスが0.2の設定ではホテル名が消える。

デノイジングストレングス0.5で看板が設置されるなど、少しずつ画像に変化が生じる。

デノイジングストレングス0.7では、プロンプトに従いよりクリエイティブな建物が生成。

人物の生成では、デノイジングストレングス0.7で殺人的な雰囲気に変化。

デノイジングストレングス1ではアジア系の顔が生成され、元画像から大きく変わる。

アニメーション画像の生成も、デノイジングストレングスでタッチが変わり、最終的に別人に。

最適なデノイジングストレングスの設定は7から8.6が推奨されている。

デノイジングストレングスの設定は試行錯誤が必要で、経験が重要。