якщо комусь цікаво, спробувавши Hedra, MultiTalk, Grok, спеціальний додаток на Google AI Studio...
Я зупинився на @runwayml для цього, яка була лише такою, яка відповідала якості, яку я хотів, але могла генерувати лише до однієї фрази для двох персонажів на покоління (коли я додавав більше, це плутало б, хто говорив тощо).
зшив їх разом і використовував різні зуми/сцени між стібками, щоб не було відчуття стрибків
Чи існують хороші моделі перетворення зображення у відео, які можуть обробляти розмови між двома або більше персонажами?
(де ви можете завантажити діалог з більш ніж одним диктором, і він відповідає персонажам, які говорять)
Чи існують хороші моделі перетворення зображення у відео, які можуть обробляти розмови між двома або більше персонажами?
(де ви можете завантажити діалог з більш ніж одним диктором, і він відповідає персонажам, які говорять)