WebGPUを使ってブラウザで画像生成する
使用したAI
Stable Diffusion
WebGPUはWebGLの後続となる規格で、ブラウザでGPU機能を使えるようです
Chromium、Firefox、WebKitなどの主要ブラウザで対応しています
WebGPUでStableDiffusionを動作できるデモサイトがあったので試してみました
どうやら画像作成に使用するチェックポイントはStableDiffusion2.1のLCM版を超圧縮したもののようです
生成に使用したパソコンはComfyUIを動かしているゲーミングPCです
ブラウザ自体のメモリ使用量は別として、画像生成でRAM 7GBほどとVRAM 6GBほどを使用していました
↓こちらで画像生成を試せます。ただし生成する前にチェックポイントの大容量ダウンロードがあります (しかもブラウザのキャッシュを消してもファイルは残り続けるので、PC内のどこに保存されたのか不明)
Stable Diffusion Turbo
https://guschmue.github.io/ort-webgpu/sd-turbo/index.html
・参考
WebAssemblyとWebGPUを用い、Webブラウザ上でStable Diffusion Turbo全体を高速実行可能な推論エンジン「ONNX Runtime Web 1.17」マイクロソフトから登場 - Publickey
https://www.publickey1.jp/blog/24/webassemblywebgpuwebstable_diffusion_turboonnx_runtime_web_117.html
――――――――――――――――――――――――――――――――――――――――――――――――――――――――
・おまけ 【RISC-V】
RISC-VのCPUでLinux環境でStableDiffusionを動かせるみたいです
生成速度は遅いようですが、x86でもARMでもないCPUで動くなんてロマンがあります
RISC-Vを試すにはOrangePi RV2が良さそうです (値段が高くていいならノートパソコン型のMUSEBookも)
Stable-Diffusion.cpp RISC-V
https://www.youtube.com/watch?v=6TWUaT8hDKA
・おまけ2 【GoogleTV】
GoogleTVに野良アプリのTermuxとOnnxStreamを使うことで画像生成できる可能性が少し存在します
↓野良アプリの入れ方
Braveブラウザ!【Google TVにインストールする方法】超簡単ガイド! - YouTube
https://www.youtube.com/watch?v=nZFSD9nrrTA
・おまけ3 【Hailo-10H】
Raspberry Pi 5に接続できる外付けAI処理ボード「Raspberry Pi AI HAT+ 2」には、
イスラエルのHailo社製のAI処理チップ「Hailo-10H」(処理性能 INT4で40TOPS) が搭載されており、
Hailo-10Hは公式によってStableDiffusion1.5を動作させるデモが行われたらしい
ラズパイでLlama3.2などのAIを実行可能な拡張ボード「Raspberry Pi AI HAT+ 2」が登場、実物はこんな感じ - GIGAZINE
https://gigazine.net/news/20260116-raspberry-pi-ai-hat-plus-2/
Offline Generative AI Stable Diffusion Creates Text to Image | Hailo
https://hailo.ai/resources/industries/personal-compute/hailo-10h-demo-stable-diffusion-on-the-edge/
Chromium、Firefox、WebKitなどの主要ブラウザで対応しています
WebGPUでStableDiffusionを動作できるデモサイトがあったので試してみました
どうやら画像作成に使用するチェックポイントはStableDiffusion2.1のLCM版を超圧縮したもののようです
生成に使用したパソコンはComfyUIを動かしているゲーミングPCです
ブラウザ自体のメモリ使用量は別として、画像生成でRAM 7GBほどとVRAM 6GBほどを使用していました
↓こちらで画像生成を試せます。ただし生成する前にチェックポイントの大容量ダウンロードがあります (しかもブラウザのキャッシュを消してもファイルは残り続けるので、PC内のどこに保存されたのか不明)
Stable Diffusion Turbo
https://guschmue.github.io/ort-webgpu/sd-turbo/index.html
・参考
WebAssemblyとWebGPUを用い、Webブラウザ上でStable Diffusion Turbo全体を高速実行可能な推論エンジン「ONNX Runtime Web 1.17」マイクロソフトから登場 - Publickey
https://www.publickey1.jp/blog/24/webassemblywebgpuwebstable_diffusion_turboonnx_runtime_web_117.html
――――――――――――――――――――――――――――――――――――――――――――――――――――――――
・おまけ 【RISC-V】
RISC-VのCPUでLinux環境でStableDiffusionを動かせるみたいです
生成速度は遅いようですが、x86でもARMでもないCPUで動くなんてロマンがあります
RISC-Vを試すにはOrangePi RV2が良さそうです (値段が高くていいならノートパソコン型のMUSEBookも)
Stable-Diffusion.cpp RISC-V
https://www.youtube.com/watch?v=6TWUaT8hDKA
・おまけ2 【GoogleTV】
GoogleTVに野良アプリのTermuxとOnnxStreamを使うことで画像生成できる可能性が少し存在します
↓野良アプリの入れ方
Braveブラウザ!【Google TVにインストールする方法】超簡単ガイド! - YouTube
https://www.youtube.com/watch?v=nZFSD9nrrTA
・おまけ3 【Hailo-10H】
Raspberry Pi 5に接続できる外付けAI処理ボード「Raspberry Pi AI HAT+ 2」には、
イスラエルのHailo社製のAI処理チップ「Hailo-10H」(処理性能 INT4で40TOPS) が搭載されており、
Hailo-10Hは公式によってStableDiffusion1.5を動作させるデモが行われたらしい
ラズパイでLlama3.2などのAIを実行可能な拡張ボード「Raspberry Pi AI HAT+ 2」が登場、実物はこんな感じ - GIGAZINE
https://gigazine.net/news/20260116-raspberry-pi-ai-hat-plus-2/
Offline Generative AI Stable Diffusion Creates Text to Image | Hailo
https://hailo.ai/resources/industries/personal-compute/hailo-10h-demo-stable-diffusion-on-the-edge/
呪文
呪文を見るにはログイン・会員登録が必須です。
イラストの呪文(プロンプト)
jacket partially removed, heart in eye, burnt clothes, holding fishing rod, kanji, doujin cover, pentagram, tape gag, adjusting headwear, red socks, friends, cloud print, coke-bottle glasses, oral invitation, competition school swimsuit, barbell piercing, gradient legwear, prisoner, blood on breasts, wind chime, carrying over shoulder, tape measure, flaming weapon
イラストの呪文(ネガティブプロンプト)
入力なし