AMUSEのモデル比較
AMUSE
では、いろいろなモデルが使えます。
モデルごとに得意分野や生成速度が違うので比較してみました。
生成マシン
GMKtec EVO-X1を使いました。
ドライバは最新版を当てています。
- CPU: AMD Ryzen AI 9 HX370
- RAM: 32GB(メイン24GB、GPUに8GB割当) LPDDR5X 7500MHz
- GPU: AMD RADEON 890M
- SSD: メイン1TB + データ保存用2TB
- OS: Windows 11 Pro/24H2/26120.3585
モデルの設定
モデルごとの雰囲気を掴むため、あえて簡単なプロンプトで作風は指定せずに出力してみました。
- 設定値はモデルロード時のデフォルト
- 出力サイズは1024px
- 512pxが標準設定の場合は
AMD XDNA Supser Resolution
でアップスケーリング
- 512pxが標準設定の場合は
- 初回はモデル読み出し・パイプライン最適化の時間がかかるため2枚目で出力時間を計測
プロンプト
best quality, ultra detailed, cyberpunk, cat is playing gadget, leather jacket, eyewear
直訳すると 最高品質、超詳細、サイバーパンク、猫がガジェットで遊んでいる、レザージャケット、メガネ
となります。
作例
それではモデルごとの作例をご覧ください!
※ 画質の評価は私の主観です
人間に強いモデルだと女の子になる確率が高め。
こういうのって男性になることはないですよね。
猫がガジェットで遊んでいる姿を生成してほしいのですが、モデルの特性によって猫だったり猫耳娘だったり獣人だったりと、いろいろ個性があっておもしろいです。
生成時間
生成された画像も大事ですが、生成時間が短いのも重要なポイントです。
1枚あたりの出力時間が短かければ何枚もガチャ出力してアタリを引く、という使い方ができます。
生成時間の短さで並べてみました。LCM系は1.6~1.8秒ほどで出力できていますが、誤差みたいなものだと思います。
個人的には Ryzen AI
有効時と Default
の差がなかったのが残念です。
モデル名 | 生成 速度 | 生成 時間 | サイズ | 画質 | 作風 |
---|---|---|---|---|---|
Cyber Realistic LCM | 超高速 | 1.6 | 512 | 中 | リアル |
AzilbPixelMix | 超高速 | 1.6 | 512 | 中 | ピクセルアート |
RealModelBase LCM | 超高速 | 1.6 | 512 | 中 | リアル |
Dreamshaper v7 LCM | 超高速 | 1.7 | 512 | 中 | リアル、ややイラスト |
Momentary LCM | 超高速 | 1.7 | 512 | 中 | リアル |
Photographer Alpha | 超高速 | 1.7 | 512 | 中 | リアル |
Dreamshaper v8 LCM | 超高速 | 1.8 | 512 | 中 | リアル |
Realistic LCM | 超高速 | 1.8 | 512 | 中 | リアル |
SDXL Turbo (RyzenAI) | 超高速 | 2.3 | 512 | 中 | リアル |
SDXL Turbo (Default) | 超高速 | 2.3 | 512 | 中 | リアル |
Dreamshaper v8 | 高速 | 8.6 | 512 | 中 | リアル、ややイラスト |
Real Cartoon 3D | 高速 | 9.1 | 512 | 高 | イラスト |
Copax Timeless XL Lightning | 中速 | 27.3 | 1024 | 中 | リアル |
Dreamshaper Lightning | 中速 | 28.9 | 1024 | 高 | リアル |
Fluently v4 LCM | 中速 | 28.9 | 512 | 中 | リアル |
RealisticVision Lightning | 中速 | 31.0 | 1024 | 高 | リアル |
Juggernaut XL v11 Lightning | 中速 | 36.1 | 1024 | 高 | リアル |
Juggernaut XL v11 | 低速 | 63.2 | 1024 | 高 | リアル、ややイラスト |
DreamDiffusion XL | 低速 | 63.9 | 1024 | 高 | リアル、ややイラスト |
Sleipnir XL | 低速 | 65.4 | 1024 | 高 | リアル、ややイラスト |
PixcelWave XL | 低速 | 66.7 | 1024 | 高 | リアル |
系統ごとの特徴
高速なLCM 系、画質はもう少し
総じて LCM
系は、2~3秒程度で超高速です。追加グラボ無しでこの速度なら文句なし。
画質はちょっと甘めですが、十分使える範囲かと思います。
人間を描写したとき、引き構図だと目や指などの細かいディティールが潰れがち。
バランスの取れた Lightning 系
30秒前後で出力できる Lightning
系は、LCM
系よりも詳細な描画がされます。
このくらいならゆっくりガチャっても良いかなと思える速度。
出力サイズが1024pxならだいぶ使えます。
画質は良いが低速な XL 系
画質は文句ないですが、1枚生成するのに1分かかるのがネック。
どうしてもこの作風が使いたい!という時にだけ使いそうです。
終わりに
ダウンロード済みのモデルだけで試しましたが、モデルや系統ごとの特徴がわかって面白かったです。
次は人物やオブジェクト、ファンタジーなど他のプロンプトでも試してみようと思います!