GPT顔
https://www.chichi-pui.com/posts/26ad7280-0c1c-43f2-b9a2-63642ecac64a/
簡単に言うと「ChatGPTの画像生成らしい顔(GPT-4o以降)」という意味で個人的には使っています。
※添付画像はGPT顔の一例。
以下、「記者手帳ムック・最新流行のAIでサボる方法」郷土通信社刊より抜粋。
【GPT顔】(ジーピーティー・がお)
「GPT顔」とは、OpenAI社の対話型AI「ChatGPT」などの画像生成機能で作られたイラストにしばしば現れる、特有の「顔の雰囲気」を指す言葉である。これは正式な専門用語ではなく俗称である。
GPT顔を特徴づけるポイントは、「特定の作品や有名キャラクターの顔を真似しているわけではないのに、なんとなく見覚えがあって、整っていて、平均的で、説明しにくい既視感を与える」という点である。多くの画像を生成していると、AIが大量の画像データを学習して統計的に「もっとも無難で好まれやすい」造形を組み合わせることで、結果的に似た印象の顔になりやすいと思われる。このような現象は、機械学習における「平均化(アベレージング)」や「確率分布の収束」という性質が視覚的に表れたものと説明されることが多いようだ。
たとえばOpenAIの元CEOであるサム・アルトマンの旧Twitter(X)のアカウント画像が「GPT顔っぽい例」として有名だろう[ >>> https://x.com/sama/photo <<< ]。これが本当にGPTによって生成されたものか不明だが、一級GPT顔鑑定士の資格を持つ郷土通信デジタル取材部のA記者によると「ぜったこれアルトマンGTPってますってマジで」だそうだ。
また、GPTを長く使っている人の中には、画像を見ただけで「これは絶対GPTで生成された顔っぽい」と感覚的にどっちつかずな判別ができるようになる場合がある。しかし、こうした能力は実生活で役立つわけでもなく、まるで意味がない。将来的には、漫画家やイラストレーターが「GPT顔」を逆輸入して、パロディ表現として作品に取り入れる可能性もあるが、月刊●●●のあの先生や、●●●漫画家と呼ばれるあの先生はすでにやっていそうだ。
──────────────────
【GPT顔回避】(ジーピーティー・がお・かいひ)
「GPT顔回避」とは、画像生成を行うときに、前述の「GPT顔」になりやすい特徴を避け、より個性的で具体性のある顔や構図を生み出すための工夫やテクニックのことを指す。これも正式な技術用語ではない。
簡単なコツは、先出のA記者によると、プロンプト(AIに指示を与える文章)の情報を広く、深く、細かくすることだという。具体的には、以下のような内容を詳細に記述する。
・髪型、髪色、瞳の色
・服装、アクセサリー
・感情、しぐさ、ポーズ
・画面の構図、カメラアングル、カメラ、レンズ
・光源やライティングの方向と強さ
・背景の環境、時間帯、雰囲気
・キャラクターの背景、物語や設定(例:探偵、魔法使い、緊張している、勝利の余韻に浸っているなど)
このように「設定を盛り込む」ことで、AIが「最も平均的で無難な顔」を生成する余地が少なくなり、結果的に顔や全体構図が個性的になる傾向があるんだとA記者は唾を飛ばして力説するが、生成AIを知らない周りはドン引きである。
さらに応用として、AI自身に「このテーマのイラストに必要な細かい要素を定義して、英語思考で英語のプロンプトを書いて」と指示し、その出力をプロンプトとして再利用する方法があるしい。これは人間が考えるよりも膨大な条件を追加するため、GPT顔から外れやすくなるとA記者は主張している。あんだけ唾飛ばしといて手抜きかよ、A。
加えて、キャラクターの表情やポーズを「大げさに」「感情豊かに」指示をすることでもGPT顔から逸脱しやすくなるらしい。感情を強調すると、AIの生成が平均値に寄りにくくなるためである。ほんとかい。
とはいえ、どれだけ工夫をしても「GPTで生成している限りGPT顔の片鱗が残り続ける」ようだ。これは生成AIの仕組みが、膨大なデータを統計的に処理して中間的な最適解を求める方式であるため、完全な回避は困難と考えられている。この項目、意味あった?
呪文
入力なし