Los modelos de lenguaje tienen más dificultades cuando los hablantes provienen de diversos contextos lingüísticos, y en ningún lugar es eso más costoso que en la navegación y el despacho de emergencias. Nuevo del equipo de Frontier Agents de Together Research: SF Streets, un banco de pruebas para evaluar el reconocimiento de entidades nombradas en 15 modelos de última generación. → 39% de tasa de error promedio en nombres de calles → Hablantes no nativos de inglés: 18% menos de precisión → Las transcripciones erróneas te dejan a 2.4 millas del objetivo La solución: transferencia de estilo multilingüe. Menos de 1,000 muestras sintéticas → 60% de mejora relativa en Whisper-Large. Los conjuntos de datos de SF Streets y US Streets se publicarán públicamente. Lee más y encuentra el artículo (enlaces abajo)
Blog: arXiv:
89