
クローズテストの開発記は、1本目です。書くつもりなかったんですが何をしたのかわからなくなるのが不安なので書きます。
動画にノイズをつける
動画生成のプロンプトに四苦八苦しながら、映像の生成に関して安定してできる部分との境目が見えてきました。映像を生成することに加えて、そこにノイズなどのエフェクトを加えてもらおうとすると絶望的に反映されなくなります。
何度もテストを繰り返せば道が見えるかもしれませんが、お財布事情的に無理なので、エフェクト自体は別処理でつけることにしました。
その後、どうせ環境サウンドしか作らない、という理由でサウンド生成大臣だったElevenlabsをリストラし、Numpyモジュールとランダムモジュールを組み合わせて毎回違ったノイズサウンドを生成させることにしました。
MinimaxやElevenlabsのAPI実装の時に、Lolipopで使えるモジュールの見当がつくようになったので、ここは思いのほかサクッと完成。
— 世界崩壊少女『初希アイ』 (@hatsukiai_TWEG) March 4, 2025
— 世界崩壊少女『初希アイ』 (@hatsukiai_TWEG) March 6, 2025
モノクロ加工後、VHS風に画質をぼやっとさせたあと、フレーム毎に分割してランダムで画像を部分的に劣化させ、最後にサウンドを合体しています。
この動画ノイズ実装に合わせて画像にもノイズをつけることにしました。
ドア開けたら、焼け臭い。手術台がある。棚にH.A.って書いてある。なんでこんなところにあるのかな…?怖いな… #ひとりぼっち #生き残り pic.twitter.com/l5VSAnGdzo
— 世界崩壊少女『初希アイ』 (@hatsukiai_TWEG) March 6, 2025
これで別の世界線からの投稿感がより現れたと思います。
エフェクトに関しては想像力を絶やさず、今後も見直して行きたいですね。
InstagramとYOUTUBEにもアップ
世界崩壊少女の初希アイはXに投稿しているという設定ですが、もう少し露出を増やそうということで、インスタとYOUTUBEにもアップすることにした。
インスタは画像。動画もアップできるけどそれは追々。
YOUTUBEは動画担当。今はクローズテストで生成した動画の中でできがよかったものだけ。
YOUTUBEは手動ですが、インスタはAPI経由でアップさせています。トークンの取り方が発狂しそうになるほど面倒だったので、やるつもりの人は時間がたっぷりある時にやるといいですね。
人が生成される問題
こうして着々と4月の本番稼働に向けて開発が進んでいるわけですが、いまだに解決できていない問題があります。それが動画の人間登場問題です。
人間が生成される問題、prompt_optimizer = false にしてから登場しなくなった。ほんとよかった。。。人影までは有りだけど、ちゃんと人影以上の存在感にはならないようにしてくれてる。
#minimax pic.twitter.com/MgibK1IahA
— ひょうごくるみ@OpenAI×X✒︎世界崩壊少女『初希アイ』テスト中 (@HYOGOKU_RUMI) March 6, 2025
minimaxの動画生成には”prompt_optimizer”という項目があり、これを “= false”にすると指示に対して厳密に生成するようになります。Trueだと指示を柔軟に解釈して、言葉足らずな部分を最適解で仕上げてくれる感じです。ほとんどの人にとってはTrueのほうが都合がいいのでしょうが、人類が滅亡した世界=人が登場しない映像、という制約がある私の方はFalseにしています。
WEBの動画生成フォームにも同様のスイッチがあり、オフにすることでFalseと同様の効果が得られます。
昨日生成した時は上記のポストのようにうまくいっていたんですが、今日やって見たらやっぱりダメでしたね。
ダメだ。。。 まだ人が登場する。 pic.twitter.com/8KeLJ1Btq4
— ひょうごくるみ@OpenAI×X✒︎世界崩壊少女『初希アイ』テスト中 (@HYOGOKU_RUMI) March 7, 2025
これを攻略するのが最終的な課題になりそうです。
今後のこと
動画は画像のように、解析してNGラベルを見つけて弾くことができないです。
やるとしたらフレーム単位で画像ファイルにして、GoogleVisionに突っ込む方法ですが……、
- 全フレームに対してやると無料枠を超える
- じゃあどうやって解析必要箇所のフレームだけ選定する?
と、課題があります。そこまでできれば、人が写ってるシーンの画像だけ外して動画に戻す、という方法がとれるのですが……。
コメント