编码机

哈佛大学提出变分注意力用VAE重建注意力

发布时间:2024/9/23 13:11:10   
注意力(attention)模型在神经网络中被广泛应用,不过注意力机制一般是决定性的而非随机变量。来自哈佛大学的研究人员提出了将注意力建模成隐变量,应用变分自编码器(VariationalAuto-Encoder,VAE)和梯度策略来训练模型,在不使用klannealing等训练技巧的情况下进行训练,目前在IWSLTGerman-English上取得了非常不错的成果。论文链接:

转载请注明:http://www.aideyishus.com/lkgx/6952.html
------分隔线----------------------------