国金证券:Alpha掘金系列之十三:AI选股模型特征筛选与处理:SHAP、中性化与另类特征.pdf |
下载文档 |
资源简介
随着机器学习模型在量化投资领域的广泛应用,我们在此前的《Alpha 掘金系列之九:基于多目标、多模型的机器学 习指数增强策略》、《Alpha 掘金系列之十:机器学习全流程重构》和《ALPHA 掘金系列之十二:排序学习对 GRU 选股 模型的增强》中,分别深入探讨了结合树模型和神经网络模型的机器学习量化选股架构、模型训练中的标签选择等细 节问题和新的排序学习框架的有效性。然而,对模型输入端因子的特征工程尚缺乏系统的研究。本报告旨在填补这一 空白,探索几个关键问题:特征选择的必要性、宏观数据与高频数据等的加入是否有益,因子与标签中性化处理的效 果。 通过对这些问题的深入探讨和实证分析,我们得出了一系列重要结论:首先,基于 SHAP(Shapley Additive Explanations)的特征选择方法显著降低了模型训练成本,并在一定程度上提升了 GRU 模型的精度,同时,SHAP 提供 的可视化工具能够直观地展示各个因子的作用,为进一步优化模型提供了有价值的参考。相比之下,尽管基于简单统 计方法的特征选择方法也取得了一定效果,但深度学习特征选择模块 STG 的表现则不太理想。其
本文档仅能预览20页