有沒有好的圖像轉視頻模型可以處理兩個或多個角色之間的對話? (可以上傳包含多個發言者的對話,並將其匹配到說話的角色)
9.31K