作者:谢玲,陈文婷,曹瀚文,肖进
摘要:客户分类一直是企业客户关系管理(CRM)中最重要的问题之一,而选择出客户的关键特征更是其中的重中之重。在大数据时代,客户数据类别分布不平衡、高维以及大量的无类别标签样本等特征让这一问题变得更为复杂,成为一个复杂的系统性决策问题。为解决这一问题,本文提出基于综合集成研讨厅的半监督客户关键特征选择模型(semi-supervised key feature se-lection of customers based on hall for workshop of meta-synthetic engineering,SFS-HWME)。该模型邀请5位相关领域的专家确定研究难点并通过定性分析寻找备选方案,然后通过综合集成得到整体解决方案,进一步进行定量分析建模。在定量分析模型中,使用半监督学习(semi-supervised learning,SSL)技术,首先使用初始有类别标签的数据集L训练Adaboost集成模型来预测无类别标签数据集U中样本的类别;接着,使用自组织映射(self-organization map,SOM)算法对数据集U进行聚类并对其中的样本进行选择性标记;然后将这些样本连同标记的类别标签一起添加到数据集L中;最后,使用重抽样技术平衡新的训练集L的类别分布,再训练数据分组处理(group method of data handling,GMDH)深度学习网络选择最优特征子集,并邀请专家从特征子集中选出最合理的。在4个客户分类数据集上进行实证分析,结果表明,和已有的一些模型相比,本文提出的SFS-HWME模型具有更好的关键特征选择性能。
发文机构:遵义医科大学医学信息工程学院 西南财经大学科研处 华为技术有限公司集团财经 四川大学商学院
关键词:综合集成研讨厅客户分类特征选择半监督学习GMDH重抽样hall for workshop of meta-synthetic engineeringcustomer classificationfeature selectionsemi-supervised learningGMDHre-sampling
分类号: TP3[自动化与计算机技术—计算机科学与技术]