2023年11月7日のOpenAI DevDayの発表以降、既存のGPT-4の機能がChatGPT『All Tools』として統合されました。
これが革命へとつながりました。
ChatGPT『All Tools』を簡単に説明すると、Pluginsを除く4つのGPT-4の機能がDefaultモードに1つのツールとして統合されたものです。
これにより、以前は個別に使用していたGPT-4の機能を、同じチャット内で切り替え無しに複数の機能を同時に使用することが可能になりました。

通常のAIは、主にテキストデータを扱いますよね。
しかし、このChatGPT『All Tools』に統合され、マルチモーダルAI『GPT-4V』とDALL-E 3を併用できるようになりました。
具体的には、テキストと画像の両方を入力情報として受け取り、それらを組み合わせて回答・出力ができるようになったのです。
実際に、フリー画像でマルチモーダルAIのすごさを試してみましょう。
次のような、AI美女のフリー画像を準備しました。

女性の服装くらいは、言語化できそうですね。
ただ、青色やピンク色の背景に関しては、なんと言葉にすればいいかモヤモヤしますよね。
これを、ChatGPTに詳しく描写してもらいましょう。

写真の女性の様子だけではなく、背景のオブジェクトや全体的な画像の雰囲気まで詳細に描写してくれました。
このようにChatGPTでDALL-E 3を活用すれば、対話の中で画像解析も可能になります。
この革命的進化により、創造の幅がますます広がることでしょう。