KAWAMOTOTAKAYUKI

Scribble at 2025-06-07 10:23:52 Last modified: 2025-06-12 21:02:08

僕が生成 AI でやりたいことの一つとして、とにかくシステムを一つ固定して、それを使って分かることをできるだけたくさん lessons として導き出したいということで、できれば機械学習という理論についても何かささやかな貢献をしたいと思っている。なので、僕がそういう目的で生成 AI を利用している状況だと、たとえば "simple background, white background, black triangle" なんていう単純なプロンプトで何千枚も生成していて、サンプリング方法とかステップとか CFG scale とかのパラメータを色々と変えたりする。つまりは初等的な科学の実験みたいなものをしていることになる。もちろん、そういう操作とか設定で何らかの有意な結果が出ると期待するだけの根拠が必要なので、闇雲にパラメータをいじくるサルみたいなことをやっても無意味であって、ちゃんとそういう変更を加えて違いを確かめるだけの素養が必要だ。なので、MarkupDancing では何度も言ってるわけだけど、最低でも修士課程のレベルでコンピュータ・サイエンスや機械学習の勉強をしていない人間が生成 AI の動作原理について解説するのは、どう考えてもインチキなんだよな。そういう素養のない人間が Stable Diffusion や ComfyUI の解説本を書いてたりするけど、そんなもん僕らに言わせればガマの油売りみたいなものだよ。

[追記:2025-06-12] 実際、最近の arXiv に掲載された画像生成 AI の論文でも、新しいアルゴリズムやモデルをテストするのに、"white background and a grey circle on the center of image" みたいなプロンプトを使っているのを見て、やはり工学の研究でも同じようにやってると分かって納得している(科学の研究だから当たり前だし、こっちも大学院の博士課程で科学哲学やってたんだから当たり前ではあるが)。

  1. もっと新しいノート <<
  2. >> もっと古いノート

冒頭に戻る