Scribble at 2025-06-29 15:04:08 Last modified: unmodified
しかし、分散型人工知能研究所(DAIR)の研究ディレクターであるアレックス・ハンナ氏は、nyuuzyouの主張に対して「非常に不誠実です。言語モデルの学習に使わないのであれば、なぜウェブ上にそんな大量の非構造データを公開する必要があるのでしょうか?」と疑問を呈しています。
データ・セットやモデルについては、僕も上のように公開していた人物への疑問を感じる。「nyuuzyouは自分がロシア在住の学生兼IT技術者であると名乗り、『二次創作に興味があるのではなく、純粋に研究目的でデータをアップロードしただけ』と語りました」というけれど、研究目的でデータ・セットを公表するというのは意味不明だ。自分の研究は自分の自宅のマシンでデータを使えばいいのであって、HuggingFace にアップロードして公表しなければ研究できないなんてことはありえないわけだよ。アップロードしているデータをクラウドのサービスからロードしてしか研究に使えないという条件があるとしても、そういうクラウド・サービスからのアクセスをプライベートな通信だけに限る API とかでやればいいわけで、「公表」する必要なんてないはずだ。誰でもアクセスできる状態に「する」ということは、要するに自己承認欲求や自己顕示欲、あるいは売名という理由しか説明がつかないだろう。あと、"nyuuzyou" はどう考えても日本語の「入場」からもってきたとしか思えないんだけど、そろそろおまえら欧米のガキは、アホみたいに軽い動機で日本語をローマ字表記で使うのはやめたらどうなんだ?