Các mô hình ngôn ngữ gặp khó khăn nhất khi người nói đến từ các nền tảng ngôn ngữ đa dạng — và không đâu tốn kém hơn là trong điều hướng và điều phối khẩn cấp. Mới từ nhóm Frontier Agents của Together Research: SF Streets, một bài kiểm tra chuẩn để kiểm tra nhận dạng thực thể tên đường trên 15 mô hình tiên tiến nhất. → Tỷ lệ lỗi trung bình 39% trên tên đường → Người nói không phải tiếng Anh: độ chính xác thấp hơn 18% → Việc ghi âm sai khiến bạn lệch 2,4 dặm so với mục tiêu Giải pháp: chuyển giao phong cách đa ngôn ngữ. Ít hơn 1.000 mẫu tổng hợp → cải thiện tương đối 60% trên Whisper-Large. Dữ liệu SF Streets và US Streets sẽ được phát hành công khai. Đọc thêm và tìm bài báo (liên kết bên dưới)
Blog: arXiv:
77