Talmodeller har det svårast när talare kommer från olika språkliga bakgrunder – och ingenstans är det dyrare än navigation och nödlarm. Nytt från Together Research Frontier Agents-teamet: SF Streets, en benchmark som stresstestar namngiven entitetsigenkänning över 15 toppmoderna modeller. → 39 % genomsnittlig felprocent på gatunamn → Icke-engelsktalande: 18 % lägre noggrannhet → Feltranskriptioner leder dig 2,4 miles från målet Lösningen: överföring av språklig stil. Färre än 1 000 syntetiska prover → 60 % relativ förbättring jämfört med Whisper-Large. SF Streets och US Streets dataset släpps offentligt. Läs mer och hitta artikeln (länkar nedan)
Blogg: arXiv:
106