当前位置: 编码机 >> 编码机前景 >> 小度科技沈健以环绕智能为核心,打通4大解
编辑
程茜
6月30日,由智东西和智东西公开课主办的GTIC全球AIoT智能家居峰会(以下简称AIoT智能家居峰会),在线上成功举办,在全网16个渠道同步直播,线上观看人数达到了90多万人,众多嘉宾的议题都引起了大家热烈讨论。
8位行业重磅大咖就AIoT智能家居的技术突破、创新应用和行业展望展开了精彩的深度探讨,直击行业痛点。
▲小度科技IoT生态业务部总经理沈健
作为小度科技IoT生态业务部总经理,沈健带来了题为《小度全屋智能:交互的变革与场景的进化》的演讲。
小度全屋智能是百度AI技术与IoT智能家居技术结合的产物,以环绕智能为核心能力的小度助手7.0,将多模态的感知理解相融合,让人与机器的交互和理解变得更加简单,这也正是小度全屋智能的核心能力。
附小度科技IoT生态业务部总经理沈健演讲实录
沈健:非常感谢组委会的邀请,借此机会我今天简单介绍一下小度在全屋智能的交互和场景方面的一些工作。
智猩猩,赞33
在整体讲解之前,我想和大家聊一个常见的单词AI,我们平常所说的是人工智能,而这里我想说的AI是AmbientIntelligence,也就是环绕智能。
我们对环绕智能的定义是这样的,将数字世界的内容和服务通过设备“编织”入物理世界,在物理世界中,智能环绕着你,持续适应、理解你所处的场景和你的偏好,在你需要时响应你,不需要时隐入环境。
环绕智能也是目前小度一个较大的中台算法团队在做的工作。在这个过程中,我们也会用到很多人工智能技术,这也符合百度的理念,通过技术来将复杂的世界变得更加简单。
我们认为,环绕智能主要有两方面能力,第一个是感知世界的能力,第二个是感知之后,能对感知到的内容进行理解的能力。
目前,在小度整个系统里,我们有三种类型的感知和理解能力,分别是语音、视觉和多重感知,接下来我会针对这三种类型的感知和理解能力进行分别介绍。
第一个是语音感知和理解,因为小度设备最初是以语音交互为主要的交互方式,因此我们认为用户对语音感知和理解已经比较熟悉了。经过几年的发展,目前小度提供的听清、听懂、满足理解能力已经是业界最好的。小度设备每天有将近几千万的用户,通过小度设备进行各种交互,有事问小度也已经成为很多用户的日常习惯,这一部分的技术我就不深入介绍了。
第二个是视觉感知和理解,一开始小度的智能型设备中,我们是以语音交互感知理解能力为主,还增加了一些视觉感知能力,例如对于儿童的屏幕保护、距离保护,AI摄像头捕捉用户的动作,然后判断用户是否距离屏幕过近。此外,我们还有通过手势控制音视频播放、远程唤醒等功能。
事实上,视觉感知和理解已经成为社会上最主要的感知和理解能力。去年,我们推出了一款新的产品小度添添智能健身镜,AI摄像头捕捉用户肢体动作,并对其进行判断,就可以对用户动作进行打分。
这个技术的实现方式是,通过AI摄像头把用户的视觉图像以每秒30帧进行捕获,上传到AI芯片中,然后通过平滑、补帧等预处理,并结合用户当前意图下所做的动作来进行判断,还会结合一些动态模型,比如当你跟着镜子中的教练进行运动时,我们会有包括计数模型、计时模型、匹配模型、动作纠正模型等,这些模型结合用户当前的动作,进行理解、匹配和动作纠正,最终给用户的动作生成结果,这个结果包括给一个动作打了多少分以及动作是不是能做的更加准确等。
这个过程中,很多用户会十分
转载请注明:http://www.aideyishus.com/lkcf/1004.html