ElevenLabs acaba de resolver la transcripción de voz. Su nuevo modelo, Scribe v2, es SOTA en tasa de error de palabras. Maneja pausas, risas y palabras complejas con facilidad. Es tan bueno segmentando a los hablantes que no cometió errores en la prueba definitiva: voces de gemelos idénticos. Cómo funciona 👇