Les modèles de discours rencontrent le plus de difficultés lorsque les locuteurs proviennent de milieux linguistiques divers — et nulle part cela n'est plus coûteux que dans la navigation et le dispatch d'urgence. Nouveau de l'équipe Together Research Frontier Agents : SF Streets, un benchmark de test de stress pour la reconnaissance d'entités nommées à travers 15 modèles à la pointe de la technologie. → 39 % de taux d'erreur moyen sur les noms de rue → Locuteurs non anglophones : 18 % de précision en moins → Les erreurs de transcription vous éloignent de 2,4 miles de votre cible La solution : le transfert de style cross-lingual. Moins de 1 000 échantillons synthétiques → 60 % d'amélioration relative sur Whisper-Large. Les ensembles de données SF Streets et US Streets seront publiés. Lisez plus et trouvez l'article (liens ci-dessous)
Blog : arXiv :
75