作者:张智聪,郑力,翁小华
摘要:采用Sarsa(λ,k)学习算法求解、产品、测试机、测试工具包、使能器部件对应关系非常复杂的半导体测试调度问题。针对测试调度,通过定义系统状态的表示方式、构造行为和报酬函数把调度问题转化为增强学习问题,并把Sarsa(λ,k)算法和梯度下降径向基神经网络函数泛化器结合使用。实验验证了Sarsa(λ,k)算法解决半导体测试调度问题的有效性。Sarsa(λ,k)算法通过反复解决调度问题来调整调度策略,能克服单个行为策略短视的缺点,综合利用各个行为策略的优点,从而找到较优的调度方案。
发文机构:广东东莞理工学院工业工程系 清华大学工业工程系 南佛罗里达大学工业与管理系统工程系
关键词:调度半导体测试增强学习多资源约束schedulingsemiconductor testreinforcement learningresource constraint
分类号: TP311.52[自动化与计算机技术—计算机软件与理论][自动化与计算机技术—计算机科学与技术]