当前位置: 编码机 >> 编码机优势 >> 基于深度学习的机器人目标识别和跟踪2
目标识别与跟踪技术的发展
1深度学习主流算法结构
1.1卷积神经网络
在21世纪初期,卷积神经网络主要应用于任务分配以及视觉识别。图像分类是机器中类别的问题用以提取特征以及辨别图像。新型的CNN神经网络架构表现出以多个网络或多种网络级联组合应用的新态势,神经网络形态的快速进化为纷繁复杂的科研领域提供了智能高效的数据分析手段。卷积神经网络(CNN)算法是用于识别和分类图像等高维数据的新兴技术,具有相对较低的计算成本和较高的准确性。CNN的隐藏层是卷积层和池化层。这些层可以提取图像的潜在特征,并通过训练映射输入图像和输出类别之间的函数关系。也就是说,这些层可以从人工分类中学习分类标准。
1.2RBM(受限玻尔兹曼机)
在过去十年中,RBM的理论和应用得到了广泛的研究。以图像处理为例,原来的RBM只适用于处理二值图像。为了处理真实图像,提出了一系列RBM变体,如高斯二进制RBM(GRBM)、协方差RBM(cRBM)、均值和协方差RBM(mcRBM)和尖峰板RBM(ssRBM)。受限玻尔兹曼机(RBM)是具有二分交互作用的概率图模型,这些模型的一个特征是观察到的单位给定隐藏单元的状态,它们是独立的,反之亦然。这是由于交互图的二部性,并且不依赖于单元的状态空间。通常RBM是用二进制单位定义的,但也考虑了其他类型的单位,包括连续、离散和混合类型单位。
1.3AE(自动编码器)
自编码器是一类人工神经网络,由编码器和解码器这两个主要组件组成。编码器是一组神经层,将其输入的原始维度限制为一个更小的维度,称为潜在空间。解码器是一组层,其目的是将潜在空间扩展回输入的原始维度。自动编码器通常使用反向传播算法进行训练,其中所需的输出与输入相同,这使其成为一种无监督学习方法。
1.4RNN(循环神经网络)
循环神经网络(RNN)对于处理数据的顺序性质至关重要,其中时间序列类型的数据就是一个典型示例。RNN具有一种具有循环连接的神经元。这些连接用作内存,使RNN能够从顺序数据中学习时间动态性。目前,LSTM神经网络模型在人类活动识别方面表现出最先进的性能。
2目标识别算法模型
WenlingXue等学者为了减少不同天气条件的影响,提出了一种新方法GMM来模拟包含不同天气数据的目标。高斯分量密度的加权和可用于表示GMM,GMM是参数概率密度函数。GMM可用于在不同天气条件下拟合目标的特性;功能数量越多,系统性能越高。为了估计GMM参数,使用训练有素的先前模型和训练数据。GMM是围绕用于检测的最佳似然比测试构建的,使用简单但有效的贝叶斯适应模型来推导天气影响。与SVM相比,GMM的识别率提高了。但存在着如何选择正确的阈值以及如何对背景噪声进行建模以提高识别率等问题。FanZhang等学者提出一种改进的YOLO深度学习模型,自动识别玉米叶片的气孔,并采用熵率超像素算法对气孔参数进行精确测量。根据气孔图像数据集的特点,对YOLOv5的网络结构进行了修改,在不影响识别性能的情况下,大大缩短了训练时间。优化YOLO深度学习模型中的预测因子,降低了误检率。同时,根据气孔物体的特点,对16倍和32倍的下采样层进行了简化,提高了识别效率。实验表明该方法快速可靠。HuiZeng等学者对非结构化网络物理系统环境交际机器人多模态感知模型进行构建。改进的PSOBT-SVM在不改变SVM分类器数量的情况下优化了分类精度,并证明了其在多模态触觉信号分类方面的准确性。
3目标识别和跟踪技术
运动物体检测是识别给定区域或区域中物体的物理运动的任务。在过去的几年中,移动物体检测因其广泛的应用而受到广泛
转载请注明:http://www.aideyishus.com/lkgx/4898.html