编码机

浅谈自然场景中的语音情感识别技术我是天

发布时间:2022/8/16 11:02:37   

语音是人类最基本、最便捷的交流工具,承载了复杂信息的语音信号不仅可以反映语义内容,还能够传递说话人内在的情感状态。语音情感识别是建立在对语音信号的产生机制深入研究与分析的基础上,对语音中反映个人情感信息的一些特征参数进行提取,并利用这些参数采用相应的模式识别方法确定语音情感状态的技术。这是人机交互领域的一个重要研究方向。语音情感识别系统主要包括语言处理和情感处理两个重要部分。语音处理是指对输入的语音信号进行处理并提取语音情感特征参数;情感处理是指对隐藏在语句中的情感信息进行识别。

语音情感识别本质上是一个典型的模式分类或回归问题,因此模式识别领域中的诸多算法都曾用于语音情感识别,包括混合高斯模型、支持向量机和隐马尔可夫模型等。虽然传统机器学习算法取得不少进展,但由于数据库的限制,以及这些方法对于大数据的拟合能力较弱,所以目前实现的情感认知水平离人们的期望还相距较远。深度学习在近几年蓬勃发展,各种不同的网络结构和算法被相继提出,并在包括情感识别在内的多个领域得到成熟应用。很大程度上,它们的成功归结于深度神经网络可以学到输入数据的一个层次非线性特征表示。常用的深度神经网络模型有深度信念网络、自动编码器、深度神经网络、卷积神经网络、循环神经网络以及对抗网络等。基于深度学习的情感识别方法具有更强的非线性建模能力,在一定程度上提升了情感识别的性能。近年来,基于注意力机制和记忆模型的情感识别方法也得到了广泛

转载请注明:http://www.aideyishus.com/lkyy/1150.html

------分隔线----------------------------

热点文章

  • 没有热点文章

推荐文章

  • 没有推荐文章