Spraakmodellen hebben de meeste moeite wanneer sprekers uit diverse taalkundige achtergronden komen — en nergens is dat kostbaarder dan bij navigatie en nooddispatch. Nieuw van het Together Research Frontier Agents-team: SF Streets, een benchmark stress-test voor named entity recognition over 15 state-of-the-art modellen. → 39% gemiddelde foutpercentage op straatnamen → Niet-Engelstalige sprekers: 18% lagere nauwkeurigheid → Foute transcripties brengen je 2,4 mijl van je doel af De oplossing: cross-linguale stijloverdracht. Minder dan 1.000 synthetische monsters → 60% relatieve verbetering op Whisper-Large. SF Streets en US Streets datasets worden openbaar vrijgegeven. Lees meer en vind het paper (links hieronder)
Blog: arXiv:
77