当前位置: 编码机 >> 编码机介绍 >> 合成语音新闻的传播效果评测关于语速影
喻国明,教育部长江学者特聘教授、北京师范大学新闻传播学院学术委员会主任、认知神经科学与传播学创新实验室主任。
王文轩,中国人民大学新闻学院博士研究生。
冯菲,北京师范大学新闻传播学院博士研究生。
修利超,北京师范大学新闻传播学院认知神经科学与传播学创新实验室副主任。
一
引言
近年来,人工智能发展迅猛,与之相伴随的智能合成语音应用迅速普及,渗透到人们生活中的方方面面,如智能硬件设备的人机交互界面、视觉障碍人士的辅助软/硬件、文本信息的语音转换等等。日常接到的销售电话、网购咨询的客服、开车使用的导航、通勤路上听的新闻等等,都充斥着智能合成语音的身影,有些交互领域甚至只有合成语音没有真人语音,如汽车导航、智能音箱交互等。
技术的进步使得合成语音越来越逼近真人,如极高相似度的音色、真假难辨的语音语调,然而,收听时对“倍速”功能的频繁使用,又用技术扭曲了逼近真人的合成语音。由于声音传播具有的高弹性接收、低门槛接入、低成本制作等优势,语音产品早已“飞入寻常百姓家”。人们浸润其中,却对这种技术赋权的媒介——合成语音的影响知之甚少。那么,长期接受合成、加速的内容产品会对人们的使用体验产生哪些影响?其作用机制如何?即是本次研究聚焦的主题。
(一)LC4MP理论内涵与意义
Lang、Potter、Bolls、Schwartz等学者以及他们的学生开始了一系列媒介生理心理学实验,实验成果逐渐形成了涵盖内容丰富的LC4MP理论(LimitedCapacityModelofMotivatedMediatedMessageProcessing),即人类拥有的是一个有限的、不变的认知资源池,利用这一有限的资源池对信息进行动态的、平行的编码(encoding),储存(storage)和检索(retrieval)。由于个体认知资源有限,能够编码、储存和检索的信息存在一个上限,不可能对消息中的所有信息进行编码和储存,因此需要不断地选择要对哪部分内容进行编码、处理和储存;个体、媒介和内容都会影响认知资源的分配(Lang,Bolls,PotterKawahara,;Lang,Zhou,Schwartz,BollsPotter,)。
认知资源的调配通过无意识的自动分配和有意识的自主控制来实现。LC4MP模型即是聚焦于自动分配处理,探究普遍的、意识控制之外的反应(Lang,;Lang,)。自动分配主要包括动机激活(motivationalactivation)和定向反应(corientingresponse)两种分配机制;人类的动机系统包括趋近和回避动机,即环境中的机会(如食物、金钱等)和威胁(如具有攻击性的人或动物、武器等);定向反应是用于提醒生物体注意环境中新的、异常(相对环境是新的,但对个体而言,未必是新的)的或具有信号特性(个体之前学到的重要或相关信息,如电话铃声,自己的名字)刺激的认知机制;当有关动机的或定向的刺激出现,就会有认知资源被自动分配来处理(Lang,);这种自动分配的机制响应时间相对较短,在几秒钟内就会发生。信息的内容和结构特征会引起定向反应和资源自动分配。
(二)研究问题
LC4MP理论将个体大脑中处理媒介信息的“黑箱操作”解剖开来,从生理心理学角度呈现受众的媒介信息感知加工。目前已有的研究多集中于语音的注意和记忆,对说服、评价的研究不多,研究对象以视频居多,聚焦于纯音频的研究很少。
这些有关语音结构方面的研究主要是对真人语音的研究,很少有专门针对合成语音形式特征的研究,且这些基于真人语音的研究结果是否适用于合成语音,不得而知。与此同时,在新闻传播领域,由于新闻质量的评价不易测量,因此研究者以更易获得的信任度(credibility)和喜爱度(liking)测量为主。研究人员先后编制了适用于印刷和在线新闻(Sundar,)以及人工智能生成新闻(Clerwall,)的测量指标。研究者还发现在内容的信任度和喜爱度等方面,真人语音与合成语音对受众的感知影响几乎一样(Nass,Foehr,BraveSomoza,)。然而,这些研究多为行为实验,很少结合生理实验。此外,前人的诸多研究显示,个体对语音信息的评价存在性别差异。
鉴于此,本研究基于LC4MP理论,将合成语音作为研究对象,以信任度和喜爱度作为因变量,将语音结构特征之一的“语速”和受众性别作为自变量进行研究,进一步丰富LC4MP理论在声音结构——语速方面的研究,同时将这一理论应用拓展至合成语音领域。
(三)语速影响传播效果的文献回顾
语音信息处理过程中,语速决定了基本韵律元素的变化,其对传播效果的影响,在理解、劝服、评价等方面已被诸多研究者讨论。
在过去的几十年中,广播电视新闻的播音速度不断加快。一项以中央人民广播电台《新闻和报纸摘要》节目为对象的调查结果表明,60年代,该节目每分钟播出个字;80年代,-字;90年代-字;年以后,每分钟播出-字,最快时达每分钟多字(谢礼逵,周振玲,2)。随着声音速度逐渐加快,人们接受信息、理解信息的能力也在提高。
有实验发现,语速能够影响说服力。较快(词/分钟,常速的1.18倍)的语速会引发年轻人更多的与情感相关和与呈现信息相关的反应,比如产品或品牌想要产生对受众的吸引力,使用快语速说服效果更佳。而如果劝服目的聚焦于更细节的,关于产品的理解,那么选用慢速(词/分钟,常速的0.85倍)语音效果更好(Megehee,DobieGrant,3)。
以往的研究还发现,语速影响人们对信息内容的信任、喜爱以及对音源人的评价。慢语速会降低人们对信息内容的
转载请注明:http://www.aideyishus.com/lkyy/3993.html