计算机与现代化 ›› 2025, Vol. 0 ›› Issue (09): 119-126.doi: 10.3969/j.issn.1006-2475.2025.09.017
• 数据库与数据挖掘 • 上一篇
摘要:
摘要:住院费用是影响乳腺癌患者治疗选择和预后的因素之一,精准预测住院费用及个性化分析费用影响因素对于有效配置资源和优化医疗服务至关重要。针对单一模型在住院费用预测任务上存在泛化能力弱且可解释差的问题,本文提出一种可解释的堆叠方法,充分整合多种模型的特征提取能力,实现对乳腺癌患者住院费用的准确预测。该方法采用2层模型融合结构,第1层选择4个基模型,并利用贝叶斯优化和五折交叉验证技术优化参数,提高每个模型的预测性能,再由第2层线性回归输出最终的费用。此外,本文还使用SHAP和LIME方法从整体和个体角度分析乳腺癌住院费用预测结果。在某医院乳腺癌住院患者数据集上的实验结果表明,堆叠方法在费用预测任务中的R2为0.877,优于其他相关研究。可解释性分析结果表明,住院时长和治疗方式是影响住院费用的主要因素,但不同患者的影响因素存在个体化差异,这为更深入了解影响住院费用的关键因素提供了宝贵的见解。
中图分类号: