当说话者来自不同语言背景时,语音模型最难应对——而在导航和紧急调度中,这种困难的代价尤为高昂。 来自Together Research Frontier Agents团队的新成果:SF Streets,一个基准压力测试,旨在评估15个最先进模型的命名实体识别能力。 → 街道名称的平均错误率为39% → 非英语使用者:准确率低18% → 错误转录使你偏离目标2.4英里 解决方案:跨语言风格迁移。少于1,000个合成样本 → Whisper-Large的相对改进达到60%。 SF Streets和US Streets数据集将公开发布。 阅读更多并查找论文(链接如下)
博客: arXiv:
108