迭代学习控制研究总结
介绍
在生活中,每个场景中都离不开对于一件事物的反复学习。一个典型的例子是篮球初学者学习投篮时,需要通过之前投篮的篮球运行轨迹来调整下次的肌肉发力与动作从而使得篮球沿着更加完美的曲线运行从而正确命中篮筐。与人们学习投篮的这个过程相似,迭代学习控制正是基于这种学习的思想,通过一次又一次的在有限步长的运行后,通过之前迭代次数的运行数据来对下次的输入量进行学习从而使得实际输出能够沿着期望的轨迹运行。

国内外研究情况
常看的课题组文章: - 国内:理论方向有沈栋教授(理论),侯忠生教授(以无模型自适应MFAC和ILC结合); - 国外:荷兰Toomen教授课题组在与ASML合作的光刻机控制中相关的研究;
前沿方向: - 应用方面主要集中在以半导体制造为代表的精密可重复的运动控制问题应用中,主要对ILC相关的模型估计、模型解耦、算法设计等方面进行结合研究; - 理论方面集中在算法融合(ILC与ADRC,MFAC等时间轴的算法),ILC在迭代轴上的改进(如增益设计,鲁棒性设计等);ILC在不同环境(如存在干扰、数据丢失等)下的研究;
学习资源与相关网站
- http://shendong.tech/DataBase/DataBase.html
- https://toomen.eu/publications.html#theses
前沿方向
理论方向
迭代学习控制的理论研究
应用研究
- 迭代学习控制在机械臂方向中的应用
- 迭代学习控制在光刻机中的应用
一些个人观点
迭代学习控制因为是面向有限时间步长设计的控制算法,因此主要应用在可重复的过程当中;
- 理论方向
- 从数据的角度出发
- 从迭代轴的角度出发
- 应用方向
- 可重复过程
随着光刻机、3D打印机、高精度机械手、列车控制系统等高精度应用的发展,越来越多的场景中需要使用迭代学习控制方法来完成高精度的操作。而模型估计类迭代学习控制算法能够通过以往的数据对系统模型信息进行学习,从而使得能够在更少的迭代次数实现更高精度的误差收敛。由于其独特的优势,模型估计类算法也会越来越多地应用到实际场景当中。对于针对于模型估计类算法所提出的改进方法,有以下几个角度能够继续进一步进行拓展与研究:
(1)沿着迭代轴进一步对控制算法进行设计与优化
沿着迭代轴进行算法设计是符合迭代学习控制特性的一种方法。首先,可以考虑沿着迭代轴设计更优的增益同时深入考虑参数的设置问题,来使得每次迭代都能达到最优。其次,将时间轴的增益设计与迭代轴的增益设计进行结合设计也是一个有吸引力的方向。最后,迭代轴不仅仅可以设置一种算法,我们需要根据迭代过程的变化来对将迭代轴划分为不同的阶段,并分别设置不同的控制器。
(2)从数据鲁棒性的角度对算法的设计进行研究
数据鲁棒性是一个新的概念与角度,这个概念的提出对数据驱动控制算法具有很强的意义,但是数据驱动控制算法的理论工作还并不成熟。一方面,需要从数据的角度针对于各种鲁棒性问题进行进一步的探索,并对其理论性进行分析。因此数据鲁棒性的理论性分析工作还有很大的空间可以探索。另一方面,也需要对数据鲁棒性角度的设计方法进行工程应用以验证其在实际场景下的可行性。
对于本文所做的工作,所提出的从增强数据鲁棒性角度来提升控制效果的策略还可以考虑其他会对数据产生影响的干扰情况。因此,在更多的环境问题下来考虑数据鲁棒性的提升从而保证控制效果是一个可以继续探索的方向。同时,从数据鲁棒性角度去设计策略这一方法并非只对干扰起作用,对于一些本身误差有波动或者收敛速度慢的算法也有改进作用,这也是未来可以探索的一个方向。