编码机

谷歌研发新的聊天机器人Meena让回答不

发布时间:2025/1/1 12:48:22   
虽然目前市面上已有很多聊天机器人,但此类开放领域聊天机器人最大的缺陷在于,回答往往达不到人们的预期,比如在问到一些特定领域问题时,它们只会给出“不知道”这一答案,虽然该回答能够“百搭”在任何问题之下,但却并未带来更好的体验。去年时,谷歌曾展示过OpenAI的GPT-2模型生成的多段连贯文字,本周在谷歌AI的一篇新论文中显示,谷歌研发出了一个全新的对话机器人Meena。Meena拥有26亿个参数的神经对话模型以及海量数据,使用GB文本训练,这些文本是从公领域社交媒体对话中过滤出来的资料,与最新产生的OpenAIGPT-2模型相比,Meena的模型大小是OpenAIGPT-2的1.7倍,训练资料量是8.5倍。因此Meena不仅可以保证连贯的对话体验,甚至还能自己讲出笑话。谷歌表示,Meena基于开源的tf-seq2seq模型(一个用于Tensorflow的通用编码器),该神经网络可以读取段落中彼此相邻的单词,并检查两者之间的关系是否有意义。随着训练的困惑度值(perplexityvalue)的降低,从而提高与人类评估指标SSA的相关性(SSA是Google判定聊天机器人质量的标准),困惑度值越低,表示产生的回答越贴切人类回答。同时Meena还具有一个编码器模块和13个译码器模块,编码器负责处理对话的上下文,帮助Meena理解对话的内容,而译码器则使用编码器处理过的信息,产生实际的回应,Google提到,经过他们调校超参数后发现,强大的译码器是提高对话质量的关键。谷歌在博客中确认,聊天机器人尚未进入应用阶段,目前谷歌更多专注在如何让Meena变得感性这一问题之上,未来会考虑其他属性,如个性和事实性。同时还要解决模型中的存在的安全性和偏差性,鉴于目前仍面临多个方面的挑战,使得Meena目前并未对外公开演示。

转载请注明:http://www.aideyishus.com/lkcf/7575.html
------分隔线----------------------------