前述した通り、従来の方法では、理想の画像を生成するには複数の段階を経て、プロンプトの調整やパラメーターを最適化しなければなりませんでした。
MidjourneyやStable Diffusionなど、他の生成AIで、「類似の画像」を生成しようとすると制約が多くありました。
プロンプトを正確に調整し、望む結果を得るためには多くの試行錯誤が必要で、手間暇のかかる作業だったのです。
これもあって、AI画像生成で完璧な結果を得るためには、かなりの時間と労力が必要でした。
しかし、DALL-E3の画像生成AIが、ChatGPT『All Tools』の中に統合されたことで、プロンプトの調整や修正作業が極端に簡略化されました。
画像認識AIは画像を解析し、その情報をもとにプロンプトを生成してくれます。
これによって、より高度な画像生成プロジェクトが実現できるのです。
例えば、次の女性の写真のような「手の様子」を、あなたならどのように表現しますか?

画像検索であれば、『人差し指 ポイント』などのワードで検索できていました。
しかし、画像生成するためのプロンプトを作るとなると意外に表現するのが難しく感じますよね。
そんな時に、ChatGPTのマルチモーダル機能が真価を発揮してくれます。
ChatGPTに直接アップロードして、聞いてしまえばいいのです。

DALL-E3は、以前までのバージョンと比べて、プロンプトの微妙なニュアンスをよく理解してくれます。
この英語で作成されたプロンプトを利用するだけで、新たにあなただけのオリジナルの画像を生成することができるのです。
この具体的な方法に関しては、第5章にて図解付きで解説しております。
ぜひご参照ください。