当前位置: 编码机 >> 编码机发展 >> 强化学习与3D视觉结合新突破高效能在线码
国防科技大学、克莱姆森大学和视比特机器人的研究人员合作使用深度强化学习求解在线装箱问题,该方法的性能表现优于现有的启发式算法。用户研究显示,该算法达到甚至超越了人类的在线码垛水平。作者团队还将训练模型部署到了工业机器人上,实现了业界首个高效能(连续码放50个以上随机尺寸箱子,空间利用率大于70%)无序混合码垛机器人。
在物流仓储场景中,无序混合纸箱码垛机器人有着大量的应用需求。对于乱序到来的、多种尺寸规格的箱子,如何用机器人实现自动、高效的码垛,节省人力的同时提升物流周转效率,是物流仓储自动化的一个难点问题。其核心是求解装箱问题(BinPackingProblem,BPP)这一经典的NP难题,即为每一个纸箱规划在容器中的摆放位置,以最大化容器的空间利用率。求解BPP问题的传统方法大多是基于启发式规则的搜索。
在实际应用场景中,机器人往往无法预先看到传送带上即将到来的所有箱子,因而无法对整个箱子序列进行全局最优规划。因而现有的BPP方法无法被直接用于真实物流场景。
事实上,人可以根据即将到来的几个箱子的形状尺寸,很快地做出决策,并不需要、也无法做到对整个箱子序列的全局规划。这种仅仅看到部分箱子序列的装箱问题,称为在线装箱问题(OnlineBPP)。物流输送线边上的箱子码垛任务一般都可以描述为OnlineBPP问题。因此,该问题的求解对于开发真正实用的智能码垛机器人有重要意义。
在OnlineBPP问题中,机器人仅能观察到即将到来的k个箱子的尺寸信息(即前瞻k个箱子),我们称其为BPP-k问题。对按序到来的箱子,机器人必须立即完成规划和摆放,不允许对已经摆放的箱子进行调整,同时要满足箱子避障和放置稳定性的要求,最终目标是最大化容器的空间利用率。OnlineBPP问题的复杂度由箱子规格、容器大小、箱子序列的分布情况、前瞻数量等因素共同决定。由于仅知道部分箱子序列的有限信息,以往的组合优化方法难以胜任。
近日,国防科技大学、克莱姆森大学和视比特机器人的研究人员合作提出了使用深度强化学习求解这一问题。该算法性能优异,实现简单,可适用于任意多个前瞻箱子的情形,摆放空间利用率达到甚至超过人类水平。同时,该团队结合3D视觉技术,实现了业界首个高效能无序混合码垛机器人。论文已被人工智能顶会AAAI大会接收。
论文链接:
转载请注明:http://www.aideyishus.com/lktp/5416.html