Моделі мовлення найбільше страждають, коли носії походять із різних мовних середовища — і це не дорожче, ніж навігація та екстрена доставка. Новинка від команди Together Research Frontier Agents: SF Streets — еталонний тест на розпізнавання іменних сутностей у 15 сучасних моделях. → середній рівень помилок у назвах вулиць 39% → Неангломовні: на 18% нижча точність → Неправильні транскрипції відправляють вас на 2,4 милі від цілі Виправлення: крос-лінгвальний трансфер. Менше ніж 1000 синтетичних зразків → 60% відносного покращення Whisper-Large. Датасети SF Streets та US Streets публікуються публічно. Дізнайтеся більше та знайдіть статтю (посилання нижче)
Блог: arXiv:
105