当前位置: 编码机 >> 编码机优势 >> Facebook开源增强版LASER库,
选自cod.fb
作者:HOLGERSCHWENK
机器之心编辑部
前不久,Facbook发布了一项新研究,提出一种可学习93种语言的联合多语言句子表征的架构。该架构仅使用一个编码器,且可在不做任何修改的情况下实现跨语言迁移。今日,Facbook开源增强版LASER库,包含上述研究的模型和代码。目前,LASER库包含93种语言工具包。
为了将NLP应用尽快部署到更多语言,Facbook的研究者拓展并改进了其LASER(Languag-AgnosticSEntncRprsntations)工具箱。今天,他们开源了第一个可探索大量多语言句子表征形式的工具——LASER,将其与NLP社区分享。据称,该工具现在能应用于涉及28种不同字符系统的90多种语言中。LASER将所有语言共同嵌入到一个共享空间中(而不是为每种语言建立一个单独的模型),从而实现这样的结果。一起开源的还包括涵盖多种语言的多语言测试集。
多语言编码器和PyTorch代码链接:
转载请注明:http://www.aideyishus.com/lkgx/680.html