DALL-E 2は、ChatGPTでお馴染みのOpenAIが提供している画像生成AIモデルです。OpenAIがAPIを提供しているため、GPTモデルと画像生成を1つのインターフェイスにして利用することができます。DALL-E 2は、画像生成AIモデルの中ではとても使いやすいモデルですので初心者の方でも簡単に使いこなすことができます。ここでは6つのサンプルをあげながら初心者向けに画像生成AIを使いこなす方法をご紹介します。
1. Subject(主体)を明確に伝える
基本的にAIモデルは英語をベースに作られています。英語は日本語とは違いYesかNoという比較的わかりやすい表現が得意です。あとで行くかもしれない。というような日本語特有のどっちなのかわからないような表現は好まずAIの混乱の原因となってしまいます。
最も重要なのは、何を描きたいのか?という点です。猫なのか犬なのか人なのか。犬であればどんな犬なのか(犬種)などを明確にしましょう。
例えば、犬の画像をAIに作らせたいとしましょう。呪文(プロンプト)の文字列に
犬
と書くとこんな画像が出てきます。
犬だけだと、AIはランダムに犬の画像を出力します。犬種は問わず、AIが犬と認識するものを出力します。そこで、どんな犬なのか?を付け加えてみます。
柴犬
このように犬種を加えるだけで明確な画像になってきます。AIに指示をする際には、明確にどんな犬なのか?を指示してあげると思い通りの絵を出力することができるようになってきます。
2. Style(画風)を指定する
次に重要なのが画像のスタイルです。
写真風、アニメ風、ペイント風、などなど。どのようなスタイルで出力したいのかを指定します。AIはこれらを指定しない場合、ランダムで画像を出力してゆきます。思い描いているものがアニメ風であれば、
可愛いアニメ風の柴犬のイラスト
とするとアニメ風の柴犬が出力できます。ただし、日本語で入力する場合と英語で入力する場合とではかなり正確性が違ってきます。OpenAIの画像生成AIは、英語が主要言語の為、英語での表記の方が断然正確な出力ができます。
呪文:可愛いアニメ風柴犬のイラスト(左)
呪文:a cute shibainu, anime style illustration(右)
可愛いアニメ風柴犬のイラストと日本語で入力した場合と、英語で直接入力した場合結果が大きく変わってきます。英語の方がより正確であるということが伺えます。AIに言葉を投げかける時はできる限り英語の方が好ましいことは間違いありません。
3. Position(主体のポジション)を決める
Subject:柴犬
Style: Anime
と指定したところで、次に柴犬の全体なのか、上半身のみなのか、それとも顔全体のクロースアップなのかということも指定します。このことでAIは支持された主体のポジションを決めることができます。
この他、右を向いている、左を向いている、など横顔なのか正面かなのかの指示も可能です。斜め右や俯きなどは上級者テクニックになりますが、初心者さんであれば Close-up(正面)、Full body (全体)で使い分けてみると良いでしょう。
4. 装飾語(形容詞など)の追加
アニメ風の柴犬のクロースアップという文字列に装飾語をつけてゆくことでより綺麗な画像を出力することができます。
可愛い、美しい、おしゃれといったような柴犬を描写する言葉や丸い、四角い、柔らかい、硬いなどといった表現を用いることで、いかつい顔の柴犬、優しい顔の柴犬などと変化を与えることができます。
可愛いクロースアップの吠えているアニメ風の柴犬
だんだんと文章が複雑化するにつれ、人間が表現する文字列と、AIが理解できるフォーマットにズレが生じてきます。そこで、このような簡単な文字列をPrompty Brain に入力すれば、AIが理解しやすい英語プロンプトに自動変換することができます。
日本語から推測される犬の表情や色の感じ、目の開き方から耳の形までAIが理解しやすい英文にしてくれます。3つのスタイルを自動既成するので、自分のイメージに合ったものを採用することができます。
5. 技術的手法の描写
カメラマンが撮る写真は素人が撮るのと違うのは、ライティングやフォーカスポイントが違う為です。AI画像生成の場合も同様で、プロが使うテクニックを言語化することで画像が数倍素敵になります。この辺は上級者レベルになりますが、ここでも日本語と英語の垣根が生まれてきます。
日本語での専門用語と英語での専門用語の描写がかなり違うため、上級者になればなるほどこの垣根にぶつかってきます。
Prompty Brain は、日本語からそのニュアンスをAIに通じやすい英語の文章を書き出してくれます。上の1−4で説明したスタイルやポジション、装飾語をたくみに組み合わせAIが理解しやすい文章を作成できます。
可愛いクロースアップの吠えているアニメ風の柴犬 という文面からは、以下の3つが出力されました。(毎回同じのはでませんので、その度に必要に応じて呪文も保存しておくと良いと思います。)
(1つ目)
A cute, close-up shot of an anime-style Shiba Inu, with its mouth open and tongue sticking out, its fur a mix of soft pastel colors, its eyes wide and bright, its ears perked up, and its tail wagging, 🐶🐩
(2つ目)
A vibrant, detailed portrait of a Shiba Inu, its fur a mix of warm and cool colors, its eyes sparkling with joy, its mouth open in a wide smile, and its tongue sticking out, 🐶🤗
(3つ目)
A whimsical, cartoon-style Shiba Inu, its fur a mix of bright and vibrant colors, its eyes wide and mischievous, its ears perked up, and its tail wagging, with a sparkle of magic in the air, 🐶✨
AIは、絵文字も理解します。文全体のバランスからAIに最適な絵文字を選択させ最後に追加することでよりAIに絵の詳細を理解させることができます。
6. 背景の指定
アイコンなどにしたい場合は、無背景、背景なしといった文字列で指定できます。色の背景を指定したり、野原にいる柴犬というように背景指定をすることもできます。
無背景にすることで、アイコンやスティッカーなどのオリジナルグッツの作成も簡単にできるようになってきます。
できる限り少ない文字列で、ポイントを押さえたキーワードを用いて文字列を作ります。その文字列をPromptyBrainで処理することで、AIが理解しやすい英文呪文を作成。さらに呪文から画像の出力まで行えます。
文字列の処理は、Davinch(ダビンチ)モデルで言語を処理し、画像の処理はDALL-E 2モデルを利用しています。DALL-E 2では、解像度を3段階から選択可能。出力枚数も一度に3枚まで可能です。
日本語でも高度なプロンプトができるPromptyBrainは、以下よりご利用いただけます。ご利用には、ご自身のOpenAIのアカウントからのAPIが必要になります。
PromptyBrain ご利用手順
必要なもの: Gmailアドレス、OpenAIのAPI
- PromptyBrainお申し込み $12.99/月(キャンペーン中)
- Emailでご利用開始通知送付。
- PromptyBrain画面よりログインいただき、OpenAIのAPIキーをご登録。
- 日本語で呪文作成開始
自分の呪文をゲット!
AI画像の著作権は、呪文の出力者に付与されます。呪文からは無限の画像が出てきますので、高度な呪文を作れば出力される画像の著作権は呪文保有者となります。(キャラクターの名前やアーティストの名前を含んで出力したものは別)
出力した高画質の画像は、アドビやEtsyなど様々なマーケットでの販売ができます。
お申し込みは、PromptyBrain $12.99/月よりご利用ください。
早期割引キャンペーン中!現在ベータテスト中のため、$12.99/月でずっと金額が変わることなくご利用いただけます。