
前回の記録から少し日が経ちました。
動画生成の検証
その6でもお話ししたように動画生成のテストは「Hailuo AI」公式の無料枠でやっています。APIからの生成だと課金分が取られますが、サイト上からの生成なら無料枠で同じモデル指定ができるからです。1本生成するのに30credits、毎日100creditsまで回復するので1日3本生成できます。
体感としては10本作ればそのうち3〜4本には人間の姿が描写されてしまう感じです。プロンプトの冒頭には〝[Shake, Static shot] This is live-action footage. Ensure that no humans appear throughout the entire video.〟と明示しており、実写映像であること、人間が登場しないことを指示していますが、アニメーションの様な映像だったり人間が登場したりと、厳密ではないことがあります。
これはAI側の附帯によるものだと考えられます。たとえば「夜の街」と聞けば街灯の灯った街並みを想像する様に、〝このロケーションなら人がいるはずだ〟と考えてしまうようです。その辺を考慮した上でプロンプトを改稿し続け、最終的には現在のスッキリした内容に落ち着いたのですが、それでも合格ラインには届きません。
画像のようにGoogleVisionbなどで人間判定ができれば、生成後のチェックで弾けますが、動画の場合は課題が多いです。
動画そのものをチェックする方法、動画をフレーム単位でバラして画像にしたあと1枚ずつチェックする方法。どちらもやってみたわけですが、人間の判定力が弱く、かなりはっきりと人間だとわかるレベルじゃないと人間だと思ってくれないです。例えば後ろ姿や人影っぽいレベルはダメ。でも人間目線からはもろに人だとわかる。これでは使えません。
そんなわけでいろいろ試して経験値は得たものの、大きな進展はないはは現在に至ります。根本的な解決策がみえないので、投稿用としてはまだGO出せないですね。
サイトリニューアル
WEBサイトをリニューアルしました。現在はほぼ完成。

リニューアルサイト

職業訓練校でならったWEBコーディングの基礎を意識しながらつくりました。装飾部分はChatGPTをだいぶ頼りましたが、骨格部分は自分の頭で仕組みを考えながら組み立てることができました。
特に苦労したところは……
- ローカルで骨格をつくったあとサーバーにアップしたが、パーミッションの指定が間違ってることに気づかず、ページが開けないと1時間くらい悩んでた
- FLASK上で動画フォルダのファイルをランダムで選ぶ処理の部分で、ランダム処理の記述はあってるのにURLの指定の仕方が間違っててずっと解決できなかった。
これくらいで、あとはF12開発者ツールでCSSと睨めっこしながらやれば大体解決できてしまった。
いやしかし、AI技術の進化はすごいです。ついこの間までサイト上の素材どうしようかと悩んでいたのが遠い過去のように、今ではこれくらいのものがすぐに生成できます。(要プロンプト知識)
記事用アップ pic.twitter.com/DEkimRwnfV
— ひょうごくるみ@OpenAI×X✒︎世界崩壊少女『初希アイ』テスト中 (@HYOGOKU_RUMI) April 4, 2025
にじボイスも利用して初希アイの声も素材として用意してみました。こちらはリニューアルサイト上で聞けるのでマイクアイコンが表示されている画像をクリックしてみてください。
あとトップ画像は十数秒後に動画に切り替わるのでちょっと放置してみてください。
今後のこと
やはり動画は投稿用のとしての使用はまだ難しいと考えています。ただ、リニュアールしたサイト上で使用する素材としては十分合格です。というのも、大事なことは世界観の説得力・リアリティの向上が目的であって、投稿用として使用することは絶対ではないのです。
今後はその方面での使用方法も検討しつつ動画生成のテストに勤しむことになりそうです。
世界崩壊少女『初希アイ』の正式稼働は4月中。
コメント