工业工程与管理 · 2009年第4期 38-44,59,共8页

基于增强学习的半导体测试调度研究

作者:张智聪,郑力,翁小华

摘要:采用Sarsa(λ,k)学习算法求解、产品、测试机、测试工具包、使能器部件对应关系非常复杂的半导体测试调度问题。针对测试调度,通过定义系统状态的表示方式、构造行为和报酬函数把调度问题转化为增强学习问题,并把Sarsa(λ,k)算法和梯度下降径向基神经网络函数泛化器结合使用。实验验证了Sarsa(λ,k)算法解决半导体测试调度问题的有效性。Sarsa(λ,k)算法通过反复解决调度问题来调整调度策略,能克服单个行为策略短视的缺点,综合利用各个行为策略的优点,从而找到较优的调度方案。

发文机构:广东东莞理工学院工业工程系 清华大学工业工程系 南佛罗里达大学工业与管理系统工程系

关键词:调度半导体测试增强学习多资源约束schedulingsemiconductor testreinforcement learningresource constraint

分类号: TP311.52[自动化与计算机技术—计算机软件与理论][自动化与计算机技术—计算机科学与技术]

注:学术社仅提供期刊论文索引,查看正文请前往相应的收录平台查阅
相关文章