Модели речи испытывают наибольшие трудности, когда говорящие приходят из различных языковых сред — и нигде это не обходится дороже, чем в навигации и экстренной диспетчерской службе. Новое от команды Together Research Frontier Agents: SF Streets, эталонное стресс-тестирование распознавания именованных сущностей на 15 современных моделях. → 39% средняя ошибка по названиям улиц → Носители неанглийского языка: на 18% ниже точность → Ошибки транскрипции отклоняют вас на 2,4 мили от цели Решение: кросс-языковой стиль передачи. Менее 1,000 синтетических образцов → 60% относительное улучшение на Whisper-Large. Датасеты SF Streets и US Streets будут выпущены публично. Читать далее и найти статью (ссылки ниже)
Блог: arXiv:
79