对于状态空间连续,行为空间离散的强化学习问题,通常的处理方法是使用函数近似器替代离散的查找表。
给出由规则并算子构造的控制器是泛模糊逼近器的充要条件。
作为通用逼近子的模糊系统及其逼近性质
利用神经网络设计航空发动机全包线最优控制器
正则模糊神经网络是模糊值函数的泛逼近器
该方法不但适用于线性系统,也适用于非线性系统;