Los modelos de habla tienen más dificultades cuando los hablantes provienen de diversos orígenes lingüísticos — y en ningún lugar eso es más costoso que en la navegación y el despacho de emergencia. Novedades del equipo de Together Research Frontier Agents: SF Streets, un benchmark de pruebas de estrés que reconoce entidades nombradas en 15 modelos de última generación. → tasa de error media del 39% en los nombres de las calles → Hablantes no ingleses: 18% menos de precisión → Las transcripciones erróneas te hacen perder el objetivo a 2,4 millas La solución: transferencia de estilo cross-lingüe. Menos de 1.000 muestras sintéticas → una mejora relativa del 60% respecto a Whisper-Large. Los conjuntos de datos de Calles de San Francisco y Calles de EE. UU. se publican públicamente. Lee más y encuentra el artículo (enlaces abajo)
Blog: arXiv:
87