существуют ли хорошие модели для преобразования изображений в видео, которые могут обрабатывать разговоры между двумя или более персонажами? (где вы можете загрузить диалог с несколькими говорящими, и он будет соответствовать персонажам, которые говорят)