AI技術研究:Google Bardの可能性
英語版Bardは、Google アカウントの言語設定を英語に変更したら利用できます。
検索すれば、説明している記事が出てくるのでここでの解説は省略します。
Bardに画像を読み込ませた結果を記述します。
1枚目:背景のみ。3枚目を読むと小説の執筆に使えるレベルで細かく書かれています。
4,5枚目:Bardが出力した英語のシーン解説をプロンプトとして利用して出力。
6枚目:座る女神。人物判定を受けて処理を受け付けてもらえない。
8枚目:大理石の彫像の女神。人物判定をすり抜けます。
11,12枚目:Bardが出力した英語のシーン解説をプロンプトとして利用して出力。
ただ、スタチューは重めのウェイトじゃないと機能しないのでここは重み付けを利用。
現時点では人物が写るものは利用できませんが、それ以外の情景の描写に対しては良い精度だと思います。
ほんと生成AIの技術は1か月経つと別物になりますね。
ワイルドカードを使ってランダムな単語を組み合わせて出力した背景をBardに説明させて、
小説やTRPGのシーン設定に使うとかが現実的かな。
テキストからイメージ。イメージからテキスト。高さの違う抽象を階段でつなげた感じだね。
知識層の技術だった言語化が大衆化したから、人間の仕事て何が残るんだろうね。
【 7月20日追記 】
MicrosoftのブラウザBing のAIチャットが画像読み込みに対応。
Bardと同じように質問する事が出来る。
人物の画像には、プライバシー保護のボカシが入る。
髪型や服装の読み取りはできる。
表情はとうぜん「ボケた」と回答。お前がボカシたやろがい!。ツッコんだら負け。
画像内容に関連する記事のURLを提案してくるので、周辺知識を得るにはいいかも。
Bardは英文で回答するから、英語学習向き。
画像を1枚用意して、まずは自分で写ってるものを英語で言ってみる。
Bardに画像を読み込ませて、右上のスピーカーマークで発音チェックしながら英文を確認する。
Bardが出力した英文を日本語に翻訳してもらう。
Google留学である。Googleなまりの話者が誕生する。
呪文
呪文を見るにはログイン・会員登録が必須です。
イラストの呪文(プロンプト)
イラストの呪文(ネガティブプロンプト)
- Steps 12
- Scale 7
- Seed 2543403548
- Sampler DPM++ SDE Karras
- Strength
- Noise
- Steps 12
- Scale 7
- Seed 2543403548
- Sampler DPM++ SDE Karras