Text to Image to Text
多くのイラストを生成して試行錯誤を重ねてきましたが、どんなに緻密な作品であっても、抽象的な作品であっても、「人間でも表現できそう」という思いが拭えませんでした。
そんなときに、「AIは結果を示すが、結果に至る過程はブラックボックスである」という話を思い出しました。
そこで、AIに「プロンプトが画像のどの部分に影響したのかを示してもらう」という新しい試みを思いつき、試してみました。
人間でも生成された画像を見て、「この部分にあのプロンプトが影響したのだろうな」と推測することはできますが、あくまでそれは推測であり、実際の過程はAIだけが知っています。
AIだけが知っている、生成の過程におけるプロンプトの影響を明らかにすることで、人間にはできない、AIだけが描ける作品を作ることに成功しました。
もちろん、文字や矢印部分は無修正です。
今回は珍しくプロンプトも公開し、その解説も行います。
・主となるプロンプトについて
2.5::Displayed~~~
初めての試みであったため、どのようなプロンプトが効果を持つのか不明でした。
そこで、「プロンプトが適用された場所に矢印とテキストを表示」という意味のプロンプトを異なる英語表現で複数採用したうえで、強調の効果を追加しました。
・調整箇所
-2::repeat::,
同じ箇所に2~3行にわたって同じテキストが表示されたため、「repeat」に負の強調を行いました。
少し前にある「The text is not duplicated」というプロンプトでも文字を重複しないように指示しました。
・表示するテキストについて
Text: girl~~~
表示するテキストはキャラクタープロンプトで使用したものを記載するように指示しました。
また、「目の部分に『red eyes』と書け」といった指定は今回のコンセプトを台無しにするので、そのようなプロンプトは使用しませんでした。
・キャラクタープロンプトについて
キャラクターはシンプルながらも特徴的な女の子にしました。
「text on body」については、文字や矢印が余白部分に限定されて表示されていたので、体の上に記載してもいいことを示しました。
・推察
作品では肩に「big breasts」とありますが、この表記は他に生成したイラストでも同様のものが多く見られました。見た目が似ているからでしょうか。
「bare shoulders」と思われる文字と矢印が胸元にあるのは、本来はその位置にあった「red kimono」が「bare shoulders」によって引き下げられたことを意味しているのかもしれません。
他に生成した作品では「red kimono」が目の部分に影響したことを示唆するものが比較的多く見られました。色が同じプロンプト(「red eyes」と「red kimono」)は相互に影響しているのかもしれません。
呪文
呪文を見るにはログイン・会員登録が必須です。