KAWAMOTOTAKAYUKI

Scribble at 2025-06-12 20:49:45 Last modified: 2025-06-12 20:57:13

添付画像

既に FLUX.1 も SD 3.5 も登場して暫く経つのだけれど、いまだにウェブではインストールや拡張機能、あるいは ComfyUI とかのフロント・エンドの解説とか LoRA のトレーニング手順とか、基本的なことをごちゃごちゃと同じような調子で解説しているやつらばっかで、ぜんぜん信用できないんだよね。

たとえば上の画像は 1920 x 1080 ピクセルの画像で、Stable Diffusion 1.5 でアップスケールしないで生成したものだ(ファイル・サイズを減らすために JPEG に変換はしている)。1.5 なんて、すでに2年前の骨董品みたいな拡散モデルだよね。それでもプロンプトや LoRA や適切なベース・モデルを組み合わせると、これくらいの画像はいくらでも出せる。最初に言及したような、やれ業務用のメモリが 48 GB のビデオ・カードで LoRA をトレーニングしてるだの、200万円のパソコンを使ってるだのと、スペック自慢しかやることがなくて、あとは Wikipedia か「としあき diffusion Wiki」みたいなところを読めばいいようなことを小出しに Note や Medium に書いてるような連中って、まったく自分たちでつくった画像を1枚もアップロードしないわけだけど、本当にそれ LoRA とかベース・モデルとか自分たちで作ってるのかね? 何割かは海外のブログ記事を、それこそ生成 AI で自動翻訳してコピペしてるだけだろうし、何割かは自分の環境ではできもしないことを適当に Wikipedia や Reddit のスレッドから記事のような体裁で AI に代筆させてるだけだろう。実際、Stable Diffusion やフロント・エンドの解説本を書いてる連中なんかは、実際問題として動作原理を全くわかっていないヘビー・ユーザ様にすぎないのであって、これは昔から率先してオンライン・サービスやアプリケーションの解説本を書いてるフリーランサーとかクラウド・ワーカーといった暇人が、背景知識も数学も通信技術も知らないド素人のヘビー・ユーザにすぎないっていうのは、ネット・ベンチャーに勤務してるていどの経験があれば誰でも知ってることだ。

あるいは、国際電通の公式ブログとかで訳知り顔に技術的な話を書いてる人たちも含めてだけど、こういう人たちが他人に見せられるような実例を作れないのは、他人に見せられるような分野の画像をふだんからぜんぜん作っていないからなんだよね。たとえば壁紙サイトに投稿できるレベルの画像とかは、ぜんぜん作ってないから作れないんだろう。代わりに、そういうブログ記事や解説本を書いてるカマトト野郎たちが何を作ってるかは、みなさんもご想像の通りだ。要するに幼女の凌辱画像とか、アニメ・キャラのレイプ画像とかだよ。こういうやつらは、そんなんばっかり作ってるから、まともな画像を実例として作れないし、アップロードもできないというわけなんだ。いやほんとに。1枚もまともな画像をアップロードしてないから、なんでそんな記事ばっか書いてる連中の話なんて、ありがたがって読んでる人がいるのか、不思議でしょうがないよ。

なので、Stable Diffusion の 1.5 だろうと 3.5 だろうと、あるいは FLUX.1 だろうと、こういうものの基本的なことしか解説してないブログを読むのは間違ってる可能性があるし、間違ってなくても Wikipedia とか Gemini に質問すれば分かる程度のことを、実体験もなしに書いてるだけから、読むのは無駄だと思うんだよね。SNS で生成 AI を目の敵にしてる人たちが怒る理由も、こういう点では分かるような気はする。

  1. もっと新しいノート <<
  2. >> もっと古いノート

冒頭に戻る