Model ucapan paling berjuang ketika penutur berasal dari latar belakang linguistik yang beragam — dan tidak ada tempat yang lebih mahal daripada navigasi dan pengiriman darurat. Baru dari tim Together Research Frontier Agents: SF Streets, benchmark stress-testing bernama pengakuan entitas di 15 model canggih. → tingkat kesalahan rata-rata 39% pada nama jalan → Penutur non-Inggris: akurasi 18% lebih rendah → Salah Transkripsi membuat Anda terjejas 2,4 mil dari target Perbaikannya: transfer gaya lintas bahasa. Kurang dari 1.000 sampel sintetis → peningkatan relatif 60% pada Whisper-Large. Kumpulan data SF Streets dan US Streets dirilis secara publik. Baca lebih lanjut dan temukan makalah (tautan di bawah)
Blog: arXiv:
81