DALL-E 2をサンプル呪文をみながら使いこなす６つのポイント

DALL-E 2は、ChatGPTでお馴染みのOpenAIが提供している画像生成AIモデルです。OpenAIがAPIを提供しているため、GPTモデルと画像生成を１つのインターフェイスにして利用することができます。DALL-E 2は、画像生成AIモデルの中ではとても使いやすいモデルですので初心者の方でも簡単に使いこなすことができます。ここでは６つのサンプルをあげながら初心者向けに画像生成AIを使いこなす方法をご紹介します。

Table of contents

1. Subject（主体）を明確に伝える
2. Style（画風）を指定する
3. Position（主体のポジション）を決める
4. 装飾語（形容詞など）の追加
5. 技術的手法の描写
6. 背景の指定
PromptyBrain　ご利用手順
自分の呪文をゲット!

1. Subject（主体）を明確に伝える

基本的にAIモデルは英語をベースに作られています。英語は日本語とは違いYesかNoという比較的わかりやすい表現が得意です。あとで行くかもしれない。というような日本語特有のどっちなのかわからないような表現は好まずAIの混乱の原因となってしまいます。

最も重要なのは、何を描きたいのか？という点です。猫なのか犬なのか人なのか。犬であればどんな犬なのか（犬種）などを明確にしましょう。

例えば、犬の画像をAIに作らせたいとしましょう。呪文（プロンプト）の文字列に　

犬

と書くとこんな画像が出てきます。

犬だけだと、AIはランダムに犬の画像を出力します。犬種は問わず、AIが犬と認識するものを出力します。そこで、どんな犬なのか？を付け加えてみます。

柴犬

このように犬種を加えるだけで明確な画像になってきます。AIに指示をする際には、明確にどんな犬なのか？を指示してあげると思い通りの絵を出力することができるようになってきます。

2. Style（画風）を指定する

次に重要なのが画像のスタイルです。

写真風、アニメ風、ペイント風、などなど。どのようなスタイルで出力したいのかを指定します。AIはこれらを指定しない場合、ランダムで画像を出力してゆきます。思い描いているものがアニメ風であれば、

可愛いアニメ風の柴犬のイラスト

とするとアニメ風の柴犬が出力できます。ただし、日本語で入力する場合と英語で入力する場合とではかなり正確性が違ってきます。OpenAIの画像生成AIは、英語が主要言語の為、英語での表記の方が断然正確な出力ができます。

呪文：可愛いアニメ風柴犬のイラスト（左）

呪文：a cute shibainu, anime style illustration（右）

可愛いアニメ風柴犬のイラストと日本語で入力した場合と、英語で直接入力した場合結果が大きく変わってきます。英語の方がより正確であるということが伺えます。AIに言葉を投げかける時はできる限り英語の方が好ましいことは間違いありません。

3. Position（主体のポジション）を決める

Subject：柴犬

Style: Anime

と指定したところで、次に柴犬の全体なのか、上半身のみなのか、それとも顔全体のクロースアップなのかということも指定します。このことでAIは支持された主体のポジションを決めることができます。

この他、右を向いている、左を向いている、など横顔なのか正面かなのかの指示も可能です。斜め右や俯きなどは上級者テクニックになりますが、初心者さんであれば Close-up（正面）、Full body (全体）で使い分けてみると良いでしょう。

4. 装飾語（形容詞など）の追加

アニメ風の柴犬のクロースアップという文字列に装飾語をつけてゆくことでより綺麗な画像を出力することができます。

可愛い、美しい、おしゃれといったような柴犬を描写する言葉や丸い、四角い、柔らかい、硬いなどといった表現を用いることで、いかつい顔の柴犬、優しい顔の柴犬などと変化を与えることができます。

可愛いクロースアップの吠えているアニメ風の柴犬

だんだんと文章が複雑化するにつれ、人間が表現する文字列と、AIが理解できるフォーマットにズレが生じてきます。そこで、このような簡単な文字列をPrompty Brain に入力すれば、AIが理解しやすい英語プロンプトに自動変換することができます。

日本語から推測される犬の表情や色の感じ、目の開き方から耳の形までAIが理解しやすい英文にしてくれます。３つのスタイルを自動既成するので、自分のイメージに合ったものを採用することができます。

5. 技術的手法の描写

カメラマンが撮る写真は素人が撮るのと違うのは、ライティングやフォーカスポイントが違う為です。AI画像生成の場合も同様で、プロが使うテクニックを言語化することで画像が数倍素敵になります。この辺は上級者レベルになりますが、ここでも日本語と英語の垣根が生まれてきます。

日本語での専門用語と英語での専門用語の描写がかなり違うため、上級者になればなるほどこの垣根にぶつかってきます。

Prompty Brain は、日本語からそのニュアンスをAIに通じやすい英語の文章を書き出してくれます。上の１−４で説明したスタイルやポジション、装飾語をたくみに組み合わせAIが理解しやすい文章を作成できます。

可愛いクロースアップの吠えているアニメ風の柴犬　という文面からは、以下の３つが出力されました。（毎回同じのはでませんので、その度に必要に応じて呪文も保存しておくと良いと思います。）

（１つ目）
A cute, close-up shot of an anime-style Shiba Inu, with its mouth open and tongue sticking out, its fur a mix of soft pastel colors, its eyes wide and bright, its ears perked up, and its tail wagging, 🐶🐩

（２つ目）
A vibrant, detailed portrait of a Shiba Inu, its fur a mix of warm and cool colors, its eyes sparkling with joy, its mouth open in a wide smile, and its tongue sticking out, 🐶🤗

（３つ目）
A whimsical, cartoon-style Shiba Inu, its fur a mix of bright and vibrant colors, its eyes wide and mischievous, its ears perked up, and its tail wagging, with a sparkle of magic in the air, 🐶✨

AIは、絵文字も理解します。文全体のバランスからAIに最適な絵文字を選択させ最後に追加することでよりAIに絵の詳細を理解させることができます。