- モデルは、画像の一部だけを編集し、それ以外の部分はそのまま維持する「ピクセルパーフェクト編集」に優れています。ユーザーは、自然な言葉で指示を出し、複数回のやり取りを通じて画像を洗練させていくことができます。これは、複雑なプロンプトを複数のステップに分解して実行する新しいパラダイムを提供します。
- 画像理解能力と画像生成能力は密接に関連しており、一方の進化がもう一方にも良い影響を与えます。画像や動画は、テキストだけでは捉えきれない世界の情報を豊富に含んでおり、これらを活用することでモデルはより賢く学習できます。
https://youtu.be/H6ZXujE1qBA?si=34QmlR87M6GAGvrV