プロンプトとは、人間がAIと話をする時に使う単語や文章です。プロンプトを使うとAIと話ができるようになります。先生が子供たちに宿題の指示をしたり、次にすることを指示したりする時に使うフレーズをイメージすると理解しやすいかもしれません。
例えば、先生が ”家族の絵を書いてください。” これがプロンプトです。または、外で遊んでいて “鉄棒に逆上がりを3回してから前周り3回をして。” これもプロンプトです。
大流行になっているGPT-3は、人が理解できる言語をプロンプトとして使えるartificial intelligence (AI) モデルです。専門的な用語や知識はなくても、自然な言語を理解できるプロンプトベースモデルが一般公開されたことで、普通の人でもAIと話ができるようになったのです。話題になっているものの1つとして、OpenAIが開発したGPT(Generative Pre-trained Transformer)というモデルがあります。現在は、GPT-3と呼ばれるバージョンが一般公開されています。175 billion パラメータを持ち人間が書くような自然な文章を作ることができるようになっています。
人の言葉が理解できるプロンプトベースのAIモデルは、去年一般公開されると急速に広まり教育やビジネスに大きな影響を与えています。具体的に何ができるのかを説明してゆきます。
GPT-3
プロンプトベースで操れるGPT-3は、OpenAIが開発したプロンプトベースのAIモデルです。プロンプトベースのモデルは、与えられた入力に基づいてテキストを生成することができるため、様々な応用が可能です。GPT-3は、膨大なデータセットを使って訓練されているので、高品質で自然な文章を生成することができます。
例えば、本のタイトルを考えてもらったり、ブログを書いてもらったりと自分のニーズに合わせてパーソナルアシスタントとして活用することもできます。
GPT-3は有料となっており、使っただけ課金されるオンディマンド課金方式になっています。(料金詳細はこちらのリンクから)
現在は4つの言語モデルが選択できます。
Adaは、 $0.0004 / 1K tokens(750 words)
Babbageは、$0.0005 / 1K tokens(750 words)
Curieは、$0.0020 / 1K tokens(750 words)
Davinciは、$0.0200 / 1K tokens(750 words)
という感じで課金されることになります。
Ada は、最も低料金で高速なモデルになります。それに反し、 Davinci は、最も高額でパワフルなモデルになっています。料金は、トークンというものが使われます。トークンは、1000トークン単位で課金される仕組みで、750単語(英語)に相当します。
1トークンは、約4文字または0.75単語となります。シェイクスピアの本が900,000語とすれば、1.2Mトークンというイメージになります。(OpenAI FAQより)
例えば、英語で1回750単語までであれば、1K単位の料金ですが、751単語になった場合は、2K料金つまりDavinciであれば、$0.02 x 2 = $0.04 かかるということになります。1回のアクションに対しかかる金額なので、出力の長さによって料金が変化します。
Davinciは、英語に特化した言語モデルなので、基本的に英語のトークン数に基づいて価格が設定されています。日本語に換算する場合、英語と文字数の数え方が違いますので、価格の計算方法も異なります。
言語モデルの選択方法は、Davinci(最もパワフル)を選択するのが一般的ですが、Curieなどは同じようなタスクを高速、かつ低価格で実現できます。シンプルな構造であればCurieでの活用も実用的ですが、トレーニングデータが、2019年までのものとなっているので2019-2021年の情報は取ることができません。
Ada: テキストの言い換え、簡単な分類、キーワードや間違えの修復などに適している。 (2019年の情報までのトレーニングモデル)
Babbage: 適度な仕分け、テキスト分析、分類などに適している。(2019年の情報までのトレーニングモデル)
Curie: 翻訳、複雑な仕分け、テキスト分析、要約などに適している。(2019年の情報までのトレーニングモデル)
Davinci: 複雑な構造、因果関係、要約などに適している。(2021年の情報までのトレーニング)
初回の利用の場合は、$18のお試しクレジットが無料で提供されます。電話番号とGoogleアカウントがあると簡単に登録できますので試してみてください。(料金詳細はこちらのリンクから)
また、GPT-3でチューニングされたChatGPTが昨年一般公開されました。
ChatGPT
プロンプトベースで自然な言語やりとりができるChatGPTは、人とAIのやり取りをまるで自然な会話が成立しているかのように再現できるようチューニングされたものです。
プロンプトという文字列を入力すると、適切な回答をしてくれます。会話が一方通行ではなくやりとりができるので、AIと自然な会話することができるようになります。多くの企業ではカスタマーサポートとして導入しており、24時間自動応対できるという活用方法が増えています。
現在無料版、有料版(ChatGPT Plus $20/月)があります。無料版でも有料版でも出力結果は変わりません。有料の場合は、
- 混雑時でも使える
- 応答速度が早い
- 新機能の優先的告知
という利点があります。現時点では、アメリカからのアクセスしかサポートしていないということなので(将来的には対応)、日本からであれば無料版で利用することになります。
ChatGPTには、言語で話しかけることができるためわからないことを聞いたり、アドバイスをもらったり。さらには、本を書いてもらったりとさまざまな活用方法があります。こちらはText to Text(文字から文字)となりますので出力はテキストベースになります。
これらの技術を使ってイラストを描く方法
これらのプロンプトベースのAIを使って Text to Image (文字からイラスト)についての詳しい情報はこちらの記事から。