画像生成AI『Stable Diffusion』で表情だけを変える方法。呪文集一覧やコツもご紹介

AI FREAK - 最新のAIツールをご紹介
23 May 202308:13

TLDR本動画では、Stable Diffusionという画像生成AIを使用して、表情を変える方法とコツを紹介しています。まず、ベースとなる画像を用意し、プロンプトを調整することで表情をつけることができます。また、レファレンスオンリー機能と併用することで、既存の画像の雰囲気を保持しながら表情を変更することが可能です。プロンプトに加える単語や数字の強調度合いを調整することで、より自然な表情を生成することができます。例えば、スマイルを強調する場合は、1.5の強調度合いが適切でしたが、悲しい表情の場合は2.0の方が適しているとされています。また、プロンプトに応じて適切な強調度合いを調整することで、より良い結果を得ることができます。最後に、表情を変えるプロンプトの一覧も紹介していますが、使用するモデルやメインのプロンプトによっても結果が変わるため、参考程度にとどめることが推奨されています。

Takeaways

  • 🖼️ プロンプトを調整することで、Stable Diffusionで表情を変えることができます。
  • 📸 ベースとなる画像を用意し、Reference Only機能と併用して表情を変更します。
  • 😄 スマイルを強調するために、プロンプトに数字を追加して調整できます。
  • 🔍 コントロールネットは、画像の雰囲気を保ちながら細かい調整を行うための便利な機能です。
  • 🔢 プロンプトに数字を追加することで、表情の強度を制御できます。
  • 😉 笑顔を生成する際、数字1.5で試してみると適切な表情が得られますが、場合によっては調整が必要。
  • 😔 悲しい表情を表現する際は、数字2.0が適しているわけではなく、プロンプトに応じて調整が必要。
  • 😠 怒っている表情を表現する際は、プロンプトと数字を組み合わせて調整することでより良い結果を得られます。
  • 🎭 表情を変えるプロンプトの一覧を提供し、それぞれの表情に適した強調度を試してみることが推奨されます。
  • 📈 強調度合いが1.5を超えると、不自然な画像が生成される可能性が高くなります。
  • 🧩 特定の画像を指定しなかった場合、強調を強くすることなくとも理想的な表情を生成できる可能性があります。

Q & A

  • ステーブルディフュージョンで表情を変える方法とは何ですか?

    -ステーブルディフュージョンで表情を変えるには、プロンプトを調整することで様々な表情を生成できます。また、レファレンスオンリー機能と併用することで、ベースとなる画像の雰囲気を保ちながら表情を変更できます。

  • プロンプトにスマイルという単語を追加することで何ができますか?

    -プロンプトに「スマイル」と追加することで、生成される画像の表情を笑顔にすることができます。数字を付け加えることで、笑顔の強度を調整し、より自然な表情を生成できます。

  • 表情を強調するためにコロンと数字を追加する仕組みとは何ですか?

    -ステーブルディフュージョンでは、プロンプトの単語の後にコロンと数字を追加することで、その単語をより強く強調できます。これにより、生成される画像の表情がより明確になる場合があります。

  • XYZプロットという機能とは何ですか?

    -XYZプロットは、ステーブルディフュージョンで使用される機能で、様々な表情を一度に表示して比較できるようになります。これにより、最適な表情を見つけるのを助けることができます。

  • 悲しい表情を生成する際、どのようなプロンプトを使えば良いですか?

    -悲しい表情を生成する際には、数字の調整だけでなく、プロンプトに「悲しい」や「動揺する」などの単語を追加することで、より感情表現豊かな画像を生成できます。

  • 怒っている表情を表現する際のコツは何ですか?

    -怒っている表情を表現する際は、プロンプトに「怒っている」や「激しい」などの単語を使用し、数字を調整することで、より強烈な表情を表現できます。

  • プロンプトに追加する単語によって表情がどのように変わりますか?

    -プロンプトに追加する単語によって、生成される画像の表情は大きく変わります。例えば、「スマイル」を追加すると笑顔になり、「アップセット」を追加すると動揺しているような表情になります。

  • 数字を調整する際にはどのようなポイントがありますか?

    -数字を調整する際は、1.5を超えると画像が変になる場合があるため、慎重に調整する必要があります。また、各プロンプトに応じて最適な数字を試行錯誤しながら見つけることが重要です。

  • レファレンスオンリー機能とは何ですか?

    -レファレンスオンリー機能は、ベースとなる画像の雰囲気を引き継ぎながら、新しい表情を加えるためのステーブルディフュージョンの機能です。これにより、元の画像の雰囲気を保ったまま表情を変えることができます。

  • 表情を変えるプロンプトの一覧を提供する理由は何ですか?

    -表情を変えるプロンプトの一覧を提供することで、ユーザーが自分の求める表情をより具体的な単語で表現し、ステーブルディフュージョンでより正確な結果を得る手助けとなります。

  • コントロールネットとは何ですか?

    -コントロールネットは、ステーブルディフュージョンで使用される機能で、画像の特定の部分を変化させることができる高度な技術です。これにより、画像全体を変えずに一部の表情を調整することが可能です。

  • ステーブルディフュージョンで表情を生成する際、何が最も重要な要素ですか?

    -ステーブルディフュージョンで表情を生成する際、最も重要な要素は、適切なプロンプト単語とその強調度合いを調整することです。これにより、より自然で希望する表情の画像を生成することができます。

Outlines

00:00

😀 Adjusting Facial Expressions in Stable Diffusion

This paragraph introduces techniques for altering facial expressions using Stable Diffusion. It guides viewers through adjusting prompts to add various expressions to an image. The process starts with preparing a base image and using the 'Reference Only' feature for maintaining the subject's atmosphere while making changes. The paragraph demonstrates how to generate an image with a smile by adding the word 'smile' to the prompt and adjusting the intensity with a numeric value. It also explores different prompts to achieve desired expressions, such as 'sad' and 'angry,' and emphasizes the importance of fine-tuning both the prompt and the numeric value for the best results. The paragraph concludes with a reminder that the effectiveness of prompts and values can vary depending on the model and main prompt used.

05:01

😠 Exploring Angry Expressions in Image Generation

The second paragraph delves into creating images with expressions of anger. It begins by setting the prompt 'angry' with a value of 1.5 to generate an image and discusses the results. The paragraph then examines other expressions that convey anger, noting the subtle differences each prompt produces. It highlights that some prompts, like 'upset,' do not convey the intended emotion at a value of 1.5. To address this, the paragraph suggests increasing the numeric value and adding emphasis to the prompt, as demonstrated by changing 'upset' to 'very upset' and generating a new image. The summary acknowledges that finding the right balance between prompt adjustments and numeric values is key to achieving the desired facial expression. It concludes with a list of prompts for changing expressions, recommending viewers to experiment with different values and resolutions for improvement.

Mindmap

Keywords

💡ステーブルディフュージョン (Stable Diffusion)

ステーブルディフュージョンは、画像生成のための人工知能モデルです。この動画では、そのモデルを使用して、画像の表情を変える方法を紹介しています。特に、プロンプトを調整することで、様々な表情を生成できると説明されています。

💡プロンプト (Prompt)

プロンプトとは、AIに指示を与えるためのテキストで、画像生成の際に表情や雰囲気を指定するために使用されます。動画では、プロンプトに「スマイル」と入力することで、笑顔の画像を生成することができると示されています。

💡コマンド (Command)

コマンドは、プロンプトに加えることで、AIの出力結果を細かく制御することができる表現です。動画では、「スマイル」の後にコロンと数字を追加することで、笑顔の強度を調整する例を紹介しています。

💡コントロールネット (Control Net)

コントロールネットとは、AIが生成する画像の特定の要素を細かく制御することができる機能です。動画では、この機能を用いて、ベース画像の雰囲気を保持したまま表情を変えることが可能です。

💡XYZプロット (XYZ Plot)

XYZプロットは、プロンプトの効果を可視化するツールで、異なる表情を生成するために使用されます。動画では、XYZプロットを使用して、様々な表情を一度に表示し、比較することができるとされています。

💡強調 (Emphasis)

強調は、プロンプト内の特定の単語や概念を重視するようにAIに指示を与えるための方法です。動画では、数字を用いて強調の程度を調整し、表情の細かい変化を制御することができると説明されています。

💡ジェネレート (Generate)

ジェネレートとは、AIに指示を与えた後、実際に画像を生成するプロセスです。動画では、プロンプトを入力し、ジェネレートボタンをクリックすることで、画像が生成される様子が紹介されています。

💡レファレンスオンリー (Reference Only)

レファレンスオンリーは、AIが生成する画像を既存の画像と比較して、類似した雰囲気を保つ機能です。動画では、この機能を用いて、ベース画像の雰囲気を引き継ぐように画像を生成することができるとされています。

💡表情 (Expression)

表情とは、顔の筋肉を使って表現される感情や感情的な状態を指します。動画では、AIが生成する画像の表情を変える方法が中心として説明されており、笑顔、悲しみ、怒りなど様々な表情の生成方法が紹介されています。

💡数字 (Number)

数字は、プロンプト内の強調の程度を制御するために使用されます。動画では、数字を変更することで、生成される表情の細かい調整が可能であることが示されています。

💡動揺 (Agitation)

動揺は、不安定さや混乱を表す感情的な状態です。動画では、「アップセット」というプロンプトを使用して、動揺を表現する表情を生成する方法が紹介されています。また、プロンプトに「ベリーアップセット」と追加することで、より強い動揺を表現することができるとされています。

Highlights

ステーブルディフュージョンを使用して表情を変える方法を紹介します。

プロンプトを調整することで、様々な表情を生成できます。

ベースとなる画像を用意し、レファレンスオンリー機能と併用して表情を調整します。

プロンプトに「スマイル」と加えることで笑顔を生成できます。

スマイルの強度を数字で指定することで、より自然な笑顔を調整できます。

数字を1.5に設定して、適度な笑顔を生成しました。

他の表情を表現するために、プロンプトに異なる単語を追加してみます。

XYZプロットを使用して、表情の一覧を表示します。

数字の調整によって、表情の微妙な変化を加えることができます。

悲しい表情を表現する際には、数字を2.0に設定して画像を生成しました。

怒っている表情を表現する際には、プロンプト「アングリー」を1.5で設定しました。

プロンプトに強調を加えることで、より強い表情を表現できます。

プロンプトと数字の調整を繰り返すことで、理想の表情を模索します。

表情を変えるプロンプトの一覧を紹介し、それぞれ1.4の強調を加えています。

強調度合いが1.5を超えると、おかしな画像が生成される確率が高くなります。

レファレンスオンリーを使用しない場合でも、強調具合によって表現に差があります。

コントロールネットと併用する場合、干渉の程度を鑑みて調整を試みます。

AIツールの最新情報を提供し、参考になる情報を共有しています。

チャンネル登録といいねボタンを押すことで、より多くの情報を提供できると嬉しいです。