会议论文(未发表)
详情
引用
Gu Y、Wang X 和Zhang M (2025) 用于口音分类的面向熟练程度的神经网络。第30届国际自动化与计算会议,拉夫堡,2025 年 8 月 27 日至 2025 年 8 月 29 日。
摘要口音在如何感知和解释语音方面发挥着至关重要的作用,特别是在企业沟通等关键环境中。许多口音分类模型都是围绕基于国籍的标签构建的,这些标签提供了非母语语音模式的简单近似,但在捕获潜在的语言特征方面受到限制。为了解决这个问题,我们提出了一种新的面向熟练的口音分类神经网络(ProNet-ACC),它使用多个公共语音数据集对非母语英语口音进行分类。我们方法的一个关键贡献是将基于国籍的口音标签转换为排名的语言能力量表,为口音分析提供信息更丰富、更平衡的框架。作为正在进行的项目的一部分,这项工作开发了一个准确率约为 94% 的早期口音分类系统,为未来使用我们自己的数据集完善该系统以及检查口音和语音模式如何影响企业沟通中的受众感知和响应奠定了基础。检查口音和语音模式如何影响企业通信中的受众感知和响应。
关键字语音识别;口音分类;神经网络
状态 | 已接受 |
---|---|
资助者 | 英国学院 |
网址 | http://hdl.handle.net/1893/37298 |
会议 | 第30届自动化与计算国际会议 |
会议地点 | 拉夫堡 |
日期 |
人数 (1)
计算科学与数学讲师,计算科学