こんにちは、Z-Image-Turbo
蒸留モデルで徹底的に軽量化されていて、ローカルでVRAM16GB以下のグラボで生成できるのがウリだそうです
日本語プロンプトや画像内への日本語書き込みができるのがすごいです
2枚目のはボードが長くなっていますが、ボードをサーフボードと捉えたようですね
↓解説サイト
Z-Image-Turboの特徴と活用方法!高速・高品質を実現する軽量画像生成モデルを徹底解説 | WEEL
https://weel.co.jp/media/tech/z-image-turbo/
↓こちらで画像生成を試せます
Z Image Turbo - a Hugging Face Space by Tongyi-MAI
https://huggingface.co/spaces/Tongyi-MAI/Z-Image-Turbo
↓ComfyUIのワークフローとファイルのダウンロード
Z Image | ComfyUI_examples
https://comfyanonymous.github.io/ComfyUI_examples/z_image/
追記:
使った感想
ローカル環境でComfyUIで生成できました。(NVIDIA RTX 3060 VRAM12GB、メモリ28GB)
最初の1枚の生成時にメモリーがオーバーフローしてSSDへの書き込みが発生しますが、2枚目以降は発生しません
奇形は出にくく、アニメ絵と実写に対応していて、肩車の絵が作れるなど基本性能は高いですが、
特に背景はほぼプロンプトと絵が1対1で対応してしまっていて多様性に乏しく、
容量相当の性能しかないかなという感じです
全裸の絵は作れますが、エロ関係のプロンプトは まず効きません
呪文
呪文を見るにはログイン・会員登録が必須です。