Modele mowy mają największe trudności, gdy mówcy pochodzą z różnych środowisk językowych — a nigdzie nie jest to bardziej kosztowne niż w nawigacji i dyspozycji w sytuacjach awaryjnych. Nowość od zespołu Together Research Frontier Agents: SF Streets, benchmarkowe testowanie rozpoznawania nazw własnych w 15 najnowocześniejszych modelach. → 39% średni wskaźnik błędów w nazwach ulic → Mówiący w innych językach: 18% niższa dokładność → Błędne transkrypcje prowadzą do 2,4 mil od celu Rozwiązanie: transfer stylu międzyjęzykowego. Mniej niż 1 000 syntetycznych próbek → 60% względna poprawa w Whisper-Large. Zbiory danych SF Streets i US Streets będą udostępnione publicznie. Przeczytaj więcej i znajdź artykuł (linki poniżej)
Blog: arXiv:
103