¿Existen buenos modelos de imagen a video que puedan manejar conversaciones entre dos o más personajes? (donde puede cargar un diálogo con más de un orador y coincide con los personajes que hablan)
4.66K