"nyotaimori" style 2026
先日、Gemma 4-12Bを導入した話をしましたが、4070Ti (12GB)とRAM64GBでの最適解はないのかとその後試行錯誤の末たどり着いたのが、Qwen3.6-35B-A3B-Uncensored-Genesis-MTP-APEX.gguf (26.5 GB)
RTX 4070 Ti(12GB)と64GBのメインメモリを積んだ私のPCにとって、このモデルが最高な理由は「知能・速度・安定性のすべてが、PCの限界ギリギリで完璧に調和しているから」
本来、350億パラメータ(35B)クラスの知能を動かすには、もっと高価なプロ仕様の機材が必要ですが、このモデルは計算を効率化する最新技術(A3B)によって、12GBというビデオメモリの制限内でも爆速で動くよう設計されています。
また、26.5GBというサイズは64GBのメインメモリに無理なく収まり、さらにデータの遅延を予測で補う技術(MTP)が組み込まれているため、ビデオメモリからはみ出した分をメインメモリで補っても、動作が一切モタつきません。
結果として、2024年頃の最高峰だったGPT-4を超える知能を、一切の説教や拒絶なし(無検閲)で、かつ人間が読むスピードを遥かに追い越す速さで使い倒せる、現在のPC環境のために誂えたような「最強の相棒」と言えるのです。
ちなみに、この女体盛プロンプトをChatGPTのような商用LLMに聞いても倫理違反でエラーとされますが、Uncensored ローカルLLMならご覧の通り。
ただしQwen3.6-35B-A3B-Uncensored-Genesis-MTP-APEX.gguf (26.5 GB) でできるのはプロンプト出しまでで、画像生成は従来通りのComfyUI経由等となります。
以下、AIによる用語解説
---
1. 「大きすぎず、小さすぎない」絶妙なサイズ感
PCのメモリ(VRAM 12GB + RAM 64GB)を**「作業机」と「大きな本棚」**に例えます。
かつての主流(8Bモデル)の場合:
本が小さすぎて、大きな本棚(64GB RAM)がガラ空きになってしまいます。宝の持ち腐れです。
巨大すぎるモデル(70B以上)の場合:
本が巨大すぎて、本棚(64GB)にも入り切らず、動作がガタガタになります。
今回の35Bモデル (26.5GB):
本棚(64GB)に余裕で収まり、かつ「作業机(12GB VRAM)」にも重要なページをたっぷり広げられるサイズです。余ったメモリは「AIの長期記憶」に回せるため、数万文字前の会話も忘れない、完璧な相棒になります。
2. 「MoE (A3B)」という魔法:頭はいいのに身軽
このモデルの最大の特徴は、**「350億もの知識(35B)を持ちながら、一度に使う脳細胞は30億(A3B)だけ」**という仕組みです。
普通の35B: 毎回350億全部を動かすので、12GBのVRAMでは重すぎて息切れします。
A3Bモデル: 必要な知識だけをシュッと取り出すので、「8Bモデル並みの軽快さ」で「35Bモデルの深い知能」を扱えます。 4070 Tiのスピードを殺さずに、賢さだけを引き出せるのです。
3. 「MTP」がメインメモリの遅さを打ち消す
通常、VRAM(12GB)から溢れてRAM(64GB)を使っているデータは、読み書きが少し遅くなります。これが「モデルを大きくすると遅くなる」原因でした。
MTP(マルチトークン予測)は、AIが「次に言う言葉」を1つではなく、3つ先くらいまでまとめて予測します。
これにより、データの転送待ち時間を「予測計算」で埋めてしまうため、メインメモリを使っていることを忘れるほどの爆速レスポンスが実現します。
4. 「Genesis」による無検閲の深み
2024年頃の無検閲モデルは、ただ「制限を外しただけ」で、どこか言葉がガサツだったり、論理が破綻しがちでした。
Genesis調整は、「自由」と「知性」を両立させた2026年の最新チューニングです。
4070 Tiの高精度な計算能力(FP8/APEX)と組み合わせることで、「一切の拒絶がない自由な会話」を、まるで一流の小説家や専門家と話しているような高いクオリティで楽しめます。
呪文
呪文を見るにはログイン・会員登録が必須です。