2 人以上のキャラクター間の会話を処理できる優れた画像からビデオへのモデルはありますか? (複数の話者との会話をアップロードでき、話しているキャラクターと一致します)
9.31K