Stable Diffusion WebUI を導入するまで
AI を触ってみて、「もっとやってみたい」と思った話
ここ最近、生成AIという言葉を聞かない日はない。 仕事でも、SNSでも、ニュースでも、どこにでも AI が顔を出すようになった。 そんな流れの中で、手元の GTX1660S でも一応はローカルでがAIができると知り、 いろいろ試しはじめたのが数か月前のことだ。
正直、1660S でも動くには動いた。 ただ、軽いモデルしか乗らないし、無理させるとすぐに落ちる。 「まあ、こんなもんか」と思いながらも、 どこかで「もっと快適に動かせたら楽しいだろうし、画像も生成できるかも」という気持ちが芽生えていた。
50歳になって、昔ほど新しいものに飛びつくタイプではなくなったけれど、 それでも“知らない世界に触れてみたい”という気持ちはまだ残っている。 20年以上パソコンと付き合ってきたけれど、 AI の世界はまた別の山のように見えた。
そんなわけで、思い切って RTX3060の12GBモデルを購入した。AI用に買い替えるならどのグラボがいい?との質問で即答されたのは、5年も前に発表された二世代前のモデルである。しかしながら生成AIにはこれがコスパ最強だそうだ 「せっかくだし グラボを買い替えて Stable Diffusion を動かしてみよう」 そんな軽い決意から、この長い作業日誌が始まった。

GitHub のログインでいきなりつまずき、気持ちが削られる
Stable Diffusion WebUI(AUTOMATIC1111)を入れるにはと、指示された手順通りにインストールを開始するのだが、PythonやGITなるもののインストールから始まる。どうも勝手が違うなと戸惑いながらも GitHub からリポジトリを clone する必要があるようだ。 「まあ、普通にログインして clone すればいいんでしょ」と思っていた。
ところが、ここでいきなり壁にぶつかる。
パスワードを入れても弾かれる。 二段階認証を通しても、なぜかまたログイン画面に戻される。
昔から、こういう“入り口でつまずく”タイプなんだよな、と苦笑いする。 最初の一歩が踏み出せないと、気持ちがじわじわ削られていく。 でも、ここでやめたら絶対に後悔する。 そんな気持ちだけで、なんとか画面に向かい続けた。
master ブランチの罠にハマり、時間だけが溶けていく
ようやくログインが通ったと思ったら、次の壁が待っていた。 AUTOMATIC1111 の master ブランチだとだめなようだ。
clone しようとすると、存在しないリポジトリを探しに行ってはエラーを吐く。 何度やっても同じ。 フォルダを消してやり直しても同じ。 GitHub のログインをやり直しても同じ。
「いや、そんなことある?」 「公式の手順が壊れてるってどういうこと?」
気づけば1時間、2時間と過ぎていく。 作業は進まないのに、時間だけが溶けていく。 こういう時の焦り方って、学生時代から変わっていない気がする。
dev ブランチで突破した瞬間の、拍子抜けと安堵
ネットで先駆者の挑戦を調べてみると、どうやら master ブランチではなく dev ブランチなら動くらしい。 「そんな裏道みたいなことある?」と思いながら、 試しに dev ブランチを clone してみた。
すると、あっさり通った。
あれだけ苦労していたのが嘘みたいに、 スルッと進んでしまった。
拍子抜けしたような、 でも肩の力がふっと抜けるような、 そんな不思議な感覚だった。
人生でも、正面突破しようとしてダメで、 ちょっと横道に入ったらうまくいく、 そんなことが何度もあった気がする。 今回もまさにそれだった。
webui-user.bat の Python パスを書き換え”
次の工程は、webui-user.bat の編集。 ここに Python のパスを手で書き込む必要がある。
正直、拾ってきたPython.exeのパスをそのまま改変してコピペするのはちょっと怖い、不安がよぎる。
でも、やるしかない。
自分用に手直しした Python へのパスをコピペして、 そっと保存する。
「頼むから動いてくれよ」と祈るような気持ちで、 BAT ファイルを実行した。
127.0.0.1 が立ち上がった瞬間の、「やっとここまで来た」感
BAT を実行すると、黒い画面に文字が流れ続ける。 エラーが出るんじゃないかと、ずっとヒヤヒヤしていた。
そしてついに、 ブラウザが自動で開き、 127.0.0.1:7860 の画面が表示された。
「……おお、ついに」 声に出してしまった。
大げさじゃなく、 ここまで来るのに何時間もかかった。すでに明け方の6時である、 途中で何度も心が折れかけた。 でも、画面が立ち上がった瞬間、 その全部が報われた気がした。
v1-5-pruned-emaonly で「cat」と打って、5秒で猫が出た日のこと
WebUI が立ち上がったら、次はテスト生成。 とりあえず、最初から入っていた v1-5-pruned-emaonly を選んで、 プロンプトに「cat」とだけ打ってみた。
生成ボタンを押す。 5秒ほど待つ。 画面に、猫が出た。
ただの猫の画像。 でも、胸の奥がじんわり温かくなった。
「え、もう出たの?」 「こんなに早いの?」
拍子抜けするくらいスムーズだった。 RTX3060 の力を、初めて実感した瞬間だった。

20年以上パソコンと付き合ってきて、進化の速さに驚く
思えば、初めてパソコンを触ったのはWindows95で、30年近く前だ。 当時は、画像を1枚開くだけでも時間がかかったし、 動画編集なんて夢のまた夢だった。
それが今では、 AI が数秒で猫を描いてくれる。
技術の進化って、本当にすごい。 でも、その便利さにたどり着くまでには、 今回みたいな泥臭い作業がある。 エラーに悩まされ、 何度もやり直し、 自分の不器用さに苦笑いしながら進む。
その過程ごと、なんだか好きだ。
最後に──50歳になっても、まだ新しいことに触れられる
以上が、私の初画像生成AIの体験記である。今回の作業を通して思ったのは、 別に AI を極めたいわけじゃなくても、 こうして“知らないものに触れてみる”だけで、 日常が少しだけ前に進むということ。
50歳になっても、 まだこうして新しいものにワクワクできる。 それだけで十分だ。
もしこの記事を読んでいる人がいたら、 難しそうに見えることでも、 ちょっと触ってみるだけで案外なんとかなるよ、 と静かに伝えたい。
技術は便利だ。 でも、その便利さにたどり着くまでの泥臭さも、 案外悪くない。 今の自分は、そんなふうに思っている。



コメント