关键词:
苹果
可溶性固形物含量
可见/近红外光谱
函数型数据分析
函数型线性回归模型
摘要:
可溶性固形物含量(SSC)是反映苹果品质和成熟度的重要指标,能够用于苹果品质分析和成熟度预测。以新疆阿克苏冰糖心红富士苹果为研究对象,从果实膨大定形期至完熟期,以3d等间隔周期采摘样本,采集其380~1110nm的可见/近红外光谱,测定其SSC,共552个样品。然后,利用基函数平滑方法将采集的可见/近红外光谱离散数据转化为光谱曲线,即函数型数据,并以可见/近红外光谱曲线、一阶导曲线、二阶导曲线为函数型解释变量,SSC为标量响应变量,分别建立函数型线性回归模型。为了验证和分析模型的性能,根据原始光谱离散数据,经过移动平滑、一阶导和二阶导预处理后,分别建立偏最小二乘回归(PLSR)、核支持向量机(KSVM)、随机森林(RF)、梯度提升树(GBM)和深度神经网络(DeepNN)。结果表明,在建立的18个模型中,针对训练集,PLSR-dNIR模型、KSVM-dNIR模型、RF-dNIR模型、GBM-dNIR模型和Deep NN-d2NIR模型都优于FunLR-NIR模型、FunLR-dNIR模型、FunLR-d2NIR模型,且Deep NN-dNIR模型最优(r_(c)=0.9996,R_(c)^(2)=0.9986,RMSEC=0.0740,RPDC=27.4366);针对测试集,FunLR-NIR模型、FunLR-dNIR模型、FunLR-d2NIR模型均优于其他所有模型,且FunLR-NIR模型最优(r_(v)=0.9534,R_(v)^(2)=0.9077,RMSEV=0.5856,RPDV=3.3017)。综合训练集和测试集的结果来看,核支持向量机模型、随机森林模型、梯度提升树模型和深度神经网络模型容易过拟合,而函数型线性回归模型具有更好的普适性。此外,从三个函数型线性回归模型(FunLR-NIR模型、FunLR-dNIR模型、FunLR-d2NIR模型)的预测效果看,模型均具有良好的鲁棒性和较高的预测精度。试验结果表明,结合可见/近红外光谱技术与函数型数据分析构建的函数型线性回归模型,可成功、有效地实现成熟期苹果的可溶性固形物含量预测。