基于增强学习的半导体测试调度研究-工业工程与管理

作者：张智聪,郑力,翁小华

摘要：采用Sarsa（λ,k）学习算法求解、产品、测试机、测试工具包、使能器部件对应关系非常复杂的半导体测试调度问题。针对测试调度,通过定义系统状态的表示方式、构造行为和报酬函数把调度问题转化为增强学习问题,并把Sarsa（λ,k）算法和梯度下降径向基神经网络函数泛化器结合使用。实验验证了Sarsa（λ,k）算法解决半导体测试调度问题的有效性。Sarsa（λ,k）算法通过反复解决调度问题来调整调度策略,能克服单个行为策略短视的缺点,综合利用各个行为策略的优点,从而找到较优的调度方案。

发文机构：广东东莞理工学院工业工程系清华大学工业工程系南佛罗里达大学工业与管理系统工程系

关键词：调度半导体测试增强学习多资源约束schedulingsemiconductor testreinforcement learningresource constraint

分类号： TP311.52[自动化与计算机技术—计算机软件与理论][自动化与计算机技术—计算机科学与技术]