编码机

技术干货如何训练高性能语义表示模型交

发布时间:2023/7/10 15:57:04   

目前,在语句编码器(sntncncodrs)领域的学术研究相当多,刚开始涉足的话,可能有点令人生畏。如果你没有正确掌握语句编码器背后的理念和其中的细微差别,就很容易感到困惑。

例如,你可能知道存在sntnctransformr(bi-ncodrs),它们的目的是为句子级别的任务产生高质量的嵌入(qualitativmbddings)。但话说回来,普通的transformr编码器也能产生较高质量的嵌入,并且完全适合句子级任务。transformr和与之对应的sntnctransformr背后的架构似乎也是相同的。然后,还有交叉编码器(cross-ncodrs)——它也被用于执行句子级的文本分类/回归任务。

这些疑问正是我们在笔者要在本文中所要阐明清楚的问题。

读完本文,你应该会对什么是sntnctransformr、双编码器(bi-ncodrs)和交叉编码器(cross-ncodrs)、何时使用它们以及它们与普通的transformr(rgulartransformrs)的关系有一个非常清楚的了解。

01

为什么需要sntnctransformrs?

一言以蔽之:

“sntnctransformr能产生比普通transformrs更好的语句语义表示,以支持某些特定的句子级的下游任务,如语义检索、文本聚类、论据挖掘等。”

详情见知乎.主题模型(topicmodl)到底还有没有用,该怎么用?,苏格兰折耳喵,

转载请注明:http://www.aideyishus.com/lkgx/5170.html

------分隔线----------------------------