Sprachmodelle haben die größten Schwierigkeiten, wenn Sprecher aus unterschiedlichen sprachlichen Hintergründen kommen – und nirgendwo ist das kostspieliger als bei Navigation und Notrufdiensten. Neu vom Together Research Frontier Agents-Team: SF Streets, ein Benchmark-Stresstest zur benannten Entitätserkennung über 15 hochmoderne Modelle. → 39% durchschnittliche Fehlerquote bei Straßennamen → Nicht-Englischsprachige: 18% geringere Genauigkeit → Fehltranskriptionen bringen Sie 2,4 Meilen vom Ziel entfernt Die Lösung: cross-lingualer Stiltransfer. Weniger als 1.000 synthetische Proben → 60% relative Verbesserung bei Whisper-Large. Die Datensätze SF Streets und US Streets werden öffentlich veröffentlicht. Erfahren Sie mehr und finden Sie das Papier (Links unten)
Blog: arXiv:
99