奥谱天成(厦门)科技有限公司
Optosky Technology Co., Ltd.
服务热线:
0592-6102588

光谱预处理对近红外光谱快速检测黄酒酒精度的影响

发表时间:2016-07-30 11:18作者:周扬 ,戴曙光来源:仪器信息网网址:http://www.instrument.com.cn/

黄酒的酒精度是黄酒品质评定重要指标,随着国外学者用近红外光谱对白酒、葡萄酒、啤酒等定量分析研究的深入,国内学者也逐步开展酒类的近红外光谱在线品质检测控制。牛晓颖[2]等用平滑、求导预处理方法结合偏最小二乘法对黄酒风味成分进行了定量分析。刘飞[3]等用导数、平滑和变量标准化结合偏最小二乘法预测了黄酒的糖度。胡小邦[4]等利用多元散射校正结合连续投影算法建立了黄酒酒精度、酸度定量检测模型。上述定量检测过程,并未针对特定的环境,对数据预处理过程进行深入研究。本文阐述了 8种传统和近年新涌现的数据预处理算法,对比分析了 8 种预处理算法对黄酒酒精度偏最小二乘定量模型预测结果的影响,剖析了每种算法在消除光谱无关信息和消除噪声上的特性,摸索出适合黄酒近红外透射光谱酒精度定量检测建模的光谱预处理方法,简化了后续建模过程,提高了预测的准确度和稳健性。

1 材料与方法

  1.1 黄酒样本与光谱采集

  黄酒实验样本采用了塔牌、古越龙山、会稽山 3 个品牌的黄酒,共计 191 个样品。黄酒中酒精度理化值依照国家标准《黄酒》(GB/T 13662-2008)和《绍兴酒》(GB/T17946-2008)中规定的检测方法,采用蒸馏法测定。样品酒精度范围为 11.7%vol 到 17.82%vol。光谱测量仪器为德国布鲁克光学仪器公司生产的MPA 傅里叶变换近红外光谱仪,使用随机附带透射样品腔附件。利用于海燕等人对黄酒品质近红外分析研究结论[5],选用光程为 1 mm 的石英比色皿,以空气为参比,采集样品透射光谱。光谱测定范围为 800~2 500 nm,分辨率为 32 cm-1,扫描次数为 20 次,采集得到黄酒样本透射光谱见图 1。

1.2 光谱预处理方法

  1.2.1 传统光谱预处理算法

   近年来,国内外文献在光谱分析领域应用比较多的光谱预处理方法有:平滑(Smoothing)、一阶导数(1stder)、二阶导数(2nd der)、多元散射校正(MSC)和标准正态变换(SNV)结合去势(De-trending)。平滑的主要目的是去除光谱中叠加的随机噪声,本文实验采用移动平均平滑法。在该法中,平滑窗口宽度大小值得探究,窗口太小,平滑去噪效果不佳,窗口太大,会平滑掉一些有用信息,造成光谱失真。本文给出了不同平滑窗宽度值的定量建模结果,选定了最佳值。导数可以有效地消除基线和其他背景干扰,分辨重叠峰,但也会引入噪声,降低信噪比,差分宽度的选择同样须引起重视,差分宽度太小,噪声较大,差分宽度过大,会导致平滑过度,丢失大量细节信息。本文同样给出了不同导数差分宽度值的定量建模结果,选定了最佳值。黄酒近红外透射光谱分辨率高,波长起伏大,宜采用 Savitzky-Galoy 卷积求导法计算。多元散射校正和标准正态变换用来消除黄酒内部固体沉淀物质颗粒大小、沉淀物质颗粒表面散射及光程变化对光谱的影响。去势算法用于标准正态变换后的光谱,来消除光谱的基线漂移。

 1.2.2 傅里叶变换(FT)

   傅里叶变换实现黄酒近红外光谱频域与时域之间的转换,把光谱分解成许多不同频率的正弦波的叠加和。数字傅里叶滤波预处理方法可以有效地滤除高频噪声以及由仪器背景或基线漂移等原因引起的低频噪声,增加光谱信噪比。通过对黄酒近红外光谱数据进行快速傅里叶变换(FFT),在频域空间与不同窗函数作用,最后进行反快速傅里叶变换(IFFT),得到经低通滤波后的光谱数据。本文给出了不同窗函数预处理后光谱的定量建模结果,给出了最佳窗函数。

 1.2.3 小波变换(WT)

  根据小波的紧支特性,小波变换使黄酒光谱信号能量集中在少数小波系数上,而使噪声信号能量分散于大多数的小波系数上。黄酒光谱信号的小波系数值大于低幅度噪声的小波系数值,故对小波系数进行阈值处理,可在小波域中消除低幅度噪声对光谱的干扰。对光谱信号采用阈值法消噪的过程可分为三步:

1) 选择一个小波基并确定一个小波分解的层次 N,对光谱信号进行 N 层分解;

2) 对第 1 层到第 N 层的小波高频系数,选择一个阈值进行硬阈值法或软阈值法处理;

3) 根据小波分解的第 N 层低频系数和经过阈值处理后的第 1 层到第 N 层的高频系数,进行光谱信号重构。

小波降噪的关键环节在于阈值的选取和阈值的量化,本文给出了 Penalty、Brige-Massart 和缺省阈值三种阈值降噪模型的黄酒近红外光谱预处理性能。

1.2.4 正交信号校正(OSC)

  正交信号校正方法,考虑了酒精浓度对黄酒近红外光谱的影响,在建立定量校正模型前,通过正交的数学方法将与浓度阵无关的光谱信号滤除,可减少建立模型所用的主因子数,达到简化模型和提高模型预测能力的目的。本文实验采用 Westerhuis 提出的直接正交信号校正(DOSC)算法,首先将黄酒近红外光谱阵 X 与浓度阵 Y 正交,然后再对正交后的光谱阵 X 进行主成分分析,求取 T 和 P,具体算法步骤如下:

2 试验结果与分析

 2.1 传统预处理后模型预测结果

  分别用平滑(Smoothing)、一阶导数(1st der)、二阶导数(2nd der)、多元散射校正(MSC)和标准正态变换(SNV)结合去势(De-trending)对采集到的黄酒近红外光谱进行预处理,并对预处理后的光谱建立酒精度偏最小二乘预测模型,偏最小二乘主成分因子数为 10,建模后采用“留一”交互验证法对模型进行评价,模型的评价指标为交叉检验相关系数(R)及交叉检验标准差(RMSECV)。模型的相关系数越高,检验标准差越小,模型的预测精度越高。表 1 显示了不同窗口宽度下平滑预处理后的模型预测效果。表 2 显示了不同差分宽度下一阶导数预处理后的模型预测效果。表 3 显示了不同差分宽度下二阶导数预处理后的模型预测效果。平滑处理是一种消除噪声的常用方法,尤其对于高斯白噪声,有良好的消除作用。采用移动平均平滑法处理光谱过程中,去除噪声时不可避免地将损失一些光谱吸收峰值信息,造成光谱失真。预处理过程中需选择合理的平滑窗口宽度,将光谱细节损失降到最小。实验证明,当平滑窗口宽度在 15 时,R=0.947 和RMSECV=0.374 88,模型预测效果最佳。

  光谱求导能消除基线和背景干扰,分辨重叠峰,提高光谱分别率。但求导过程中如果差分宽度选择不当,将锐化噪声,反而使建模效果下降。对比表 2、3 数据分析可得,差分宽度为 55 时,一阶导数预处理效果最佳。差分宽度为 25 时,二阶导数预处理效果最佳。对比平滑和求导两种预处理方法,平滑效果普遍要优于求导效果,说明本实验采集的黄酒近红外透射光谱,受较多的随机噪声干扰,求导过程会锐化了噪声,降低了信噪比,故反而使建模效果下降。表 4 显示在 15 点平滑(Smoothing)、55 点一阶导数(1st der)、25 二阶导数(2nd der)与多元散射校正(MSC)和标准正态变换(SNV)结合去势(De-trending)光谱预处理后建模效果的比较。 

分析表 4 可知,15 点平滑后建模效果 R=0.047 和 RMSECV=0.374 88 仍然要优于多元散射校正和标准正态变换结合去势。多元散射校正和标准正态变换效果相似,主要消除黄酒液体中悬浮物散射、表面散射和光程变化的影响。结果表明,黄酒样本的悬浮固体较少、表面散射小,仪器的光程稳定,故散射和光程变化并不是建模精度的主要影响因素,这也是多元散射校正和标准正态变换预处理效果不如平滑的主要原因。针对降噪为主的预处理目标,下文采用了傅里叶变换和小波变换滤波降噪来进一步提高模型预测效果。

2.2 傅里叶变换、小波变换及正交信号校正预处理模型预测结果

  分别用傅里叶变换(FT)、小波变换(WT)和正交信号校正(OSC)对采集到的光谱进行预处理,并对预处理后的光谱建立酒精度偏最小二乘预测模型,偏最小二乘主成分因子数为 10。傅里叶变换后对黄酒近红外光谱频域加窗滤波,频域滤波分别使用了海明窗(Hamming)、凯撒窗(Kaiser)和矩形窗(Squre)。小波变换降噪中,选用 SYM6 小波,进行 5 层分解,选取了 Penalty、Birge-Massart 和缺省(Default)三种阈值降噪模型。建模后采用“留一”交互验证法对模型进行评价,模型的评价指标仍然为交叉检验相关系数(R)及交叉检验标准差(RMSECV)。表 5 显示了傅里叶变换、小波变换和正交信号校正预处理后的模型预测效果。

  分析表 5 数据可知,在光谱傅里叶变换后频域加海明窗后,傅里叶变换预处理效果最佳。选取Birge-Massart 阈值降噪模型,小波降噪预处理效果最佳。傅里叶降噪和小波降噪预处理后模型预测效果要优于平滑等传统数据预处理方法。结果显示把光谱投影分解后,噪声的特征更加容易在投影域中展现,在傅里叶变换中选取海明窗和在小波变换中运用 Birge-Massart 阈值策略,比传统数据预处理方法更有效地滤除光谱信号中的噪声。小波降噪的效果要优于傅里叶降噪,因为与傅里叶变换相比,小波变换具有时-频局部化特性,能多角度分析噪声信号投影,并加以滤除。