奥谱天成(厦门)科技有限公司
Optosky Technology Co., Ltd.
服务热线:
0592-6102588

葡萄中糖含量的近红外检测技术研究与仪器开发

发表时间:2016-06-07 09:41作者:王亚红来源:万方数据网址:http://www.wanfangdata.com.cn/

  目前,人们对生活质量的要求也越来越高,消费者在购买水果的时候除了看重水果的外观品质,更注重水果的内部品质(糖度、酸度等)。然而,传统检测水果内部品质的方法都要对水果进行破外,例如对水果糖度的测量,一般都是取水果果肉进行榨汁,取少量汁液用碘滴定或者菲林试剂进行滴定,或者采用酶-比色法、高效液相色谱等进行糖度的检测,但这些方法操作时间长,费用较高,不适用于在线分析,而且对商品进行了破坏,不能达到无损检测的目的。无损检测就是通过获取样品的物理性质,如力学、热学、光学或者声学特性等,来判断样品的内部品质。目前水果无损检测技术有很多,但是光学方法是应用最广泛、最成功的一种,光谱法是利用物质与光相互作用的特性来确定某种成分含量的一种非破坏性检测方法。利用该技术,可以实时检测果实内部某些成分的含量,为果园的栽培管理提供科学依据,提高水果的内部品质; 其次, 利用该技术还可以提高水果商品化处理的效率, 降低工人的劳动量,提高水果的附加值,从而提高我国产品在国际市场以及国内市场的竞争力。

1.2 近红外光谱技术的发展概述

  近红外光谱(Near Infrared Spectra, NIRS)是赫歇耳(W Herschel)于 1800 年发现的, 是发现最早的非可见光, 它是介于紫外-可见光 (UV-Vis) 和中红外 (Mid-InfraredSpectra, MIRS)之间的电磁波。近红外光谱的波长范围:700~2500nm(14286~4000cm-1),通常也可分为短波(700~1000nm)和长波(1100~2500nm)近红外两个区域。与中红外光谱吸收特征相比,NIR 的吸收非常弱,谱带宽而且交叠严重,几乎没有明显的峰出现,所以,在 20 世纪 50~60 年代近红外光谱一度被人们遗忘,仅在工业化学品和药品等分析方面有些应用研究报道, 但较为零散, 没有引起人们的重视。20 世纪 70 年代初期, 化学计量学学科的诞生, 计算机的普及以及化学仪器的现代化,使得科学家通过处理数据并从中提取有用信息成为可能, 使近红外光谱技术再一次被科学家所重视。直到 1986 年,美国农业部的工程师 K Norris 博士,采用漫反射技术测定谷物的近红外光谱,将多元线性回归方法用于 NIR 定量分析。这类方法建立了现代 NIR 分析技术的基础。随着 NIR 仪器的不断改进、材料科学的发展以及化学计量学数据处理方法的应用,NIR 技术逐渐被广泛应用在工业、农业、生命科学、医药学科等领域从 20 世纪 80 年代起,严衍禄教授为近红外光谱技术在农业领域中的应用做着不懈的努力。20 世纪 90 年代中期,陆婉珍院士在石油化工科学研究院成立了近红外光谱课题组,研发出了成套的近红外光谱分析软件,并将其应用于多套炼油生产装置,为企业带来了可观的经济效益和社会效益。

1.3 水果近红外检测国内外研究现状
1.3.1 国外研究现状

 Lu利用近红外光谱作为工具对甜樱桃的糖度和硬度进行了预测研究,实验选取 800nm~170nm 波段的光谱,实验样品为“Hedelfinger”和“Sam”两个品种的甜樱桃,结合了偏最小二乘法对两个品种的糖度和硬度进行了预测,达到了良好的效果,相关系数分别为 0.8 和 0.65,并且证明了近红外光谱可以用来预测樱桃的糖度和硬度两个品质。 Park采用双光束, 光纤便携式分光光度计结合主成分回归(principal componentregression,PCR)方法,对苹果的可溶性固形物的含量以及坚实度进行定量分析,实验选用“Red Delicious”和“Gala”两种苹果,Gala 苹果可溶性固形物的 PCR 模型结果是:决定系数 R2=0.934,SEP=0.279,Red Delicious 苹果可溶性固形物的预测结果是:决定系数 R2=0.966,SEP = 0.341;结合 PCR 方法分别对两种苹果的坚实度进行定量分析,其中,Gala 苹果坚实度的 PCR 模型结果是:R2=0.218,SEP=4.91,RedDelicious 苹果坚实度的 PCR 模型结果是:R2=0.786,SEP=7.02。所以,两种苹果的糖度预测结果比较理想,坚实度的预测结果较差。Gomez等人通过采集无核小蜜橘的可见/近红外光谱 (400~2350 nm),预测小蜜橘的品质特性(硬度,可溶性固体物质,PH),文章采用平滑、MSC 方法对原始光谱进行预处理,并对预处理后的光谱进行主成分回归(Principal Components Regression,PCR)和偏最小二乘法(Partial leastsquares,PLS)建模分析,其中以 PLS 建模分析的结果最好,小蜜橘的硬度,可溶性固体物质,PH 的相关系数分别为 0.83,0.94,0.8,预测标准偏差(Root mean squareerror of prediction, RMSEP)分别为 8.53,0.33,0.18,所以,利用可见/近红外光谱对小蜜橘进行品质特性的预测是可行的。 Subedi等人利用短波近红外光谱预测芒果成熟期的干物质含量以及可溶性固形物的值判断水果的成熟度。Cayuela通过采集完整橘子的可见/近红外波段的反射比光谱, 建立模型预测橘子的糖度, 酸度以及 PH 值,结果表明,采用反射比方式采集的橘子的光谱对酸度和 PH 值的预测是不可行的。其中,校正集模型糖度的预测结果为:决定系数 R2=0.91,SECV = 0.51。验证集的糖度预测结果是 RMSEP = 0.51。Nicolai等人采用时间分辨的连续近红外透反射方式预测梨果的可溶性固形物的含量以及梨果的硬度。Moghimi等人采集猕猴桃的 400~1000nm 波段的透射光谱,利用 PLS 并且结合多元散射校正(multiplicative scattercorrection, MSC)、标准正态变量变换(standard normal variate transformation, SNV)、中值滤波以及一阶导数预处理方法,对猕猴桃的可溶性固形物(Soluble solids Content,SSC)和 PH 进行预测分析,其中,原始光谱依次经过 SNV、中值滤波,一阶导数预处理后的光谱建模结果最佳,预处理后的 PLS 的建模结果:SSC 以及 PH 相关系数分别为 0.93, 0.943,预测标准偏差(RMSEP)分别为 0.259,0.076。Antonucci等人采用偏最小二乘法分别对 Page 柑橘和 Miho 柑橘的可滴定酸度(Titratable acidity, TA)和总可溶性固形物(Total soluble solids, TSS)进行建模分析。其中,Page 柑橘的 TA,TSS的相关系数 R 分别是 0.88,  0.85,预测标准偏差 SEP 为 3.8%,4%。Miho 柑橘的TA,TSS 的相关系数 R 分别是 0.81,0.84,预测标准偏差 SEP 为 8.3%,5.6%。


1.3.2 国内研究现状

 20 世纪 80 年代,我国才开始将近红外光谱技术运用到水果的无损检测研究中,与国外相比,起步较晚。吕强,汤明杰,赵杰文等利用了标准正态变量变换对猕猴桃1000~2500nm 波段近红外光谱进行了预处理,并简化了猕猴桃硬度偏最小二乘法(PLS)模型,找出了各模型性能最佳的波段。浙江大学的陈明林在优选波段基础上采用逐步多元线性回归(Stepwise Multi- Linear Regression, SMLR)、偏最小二乘支持向量机回归(Leasts quare support vector machine, LS-SVM)以及全波段光谱信息下采用偏最小二乘法,对比分析了苹果糖度,酸度的三种定量分析模型的预测精度,结果表明,未经处理的原始光谱所建立的 SMLR 模型预测精度最高,其中,基于 6个波长的 SMLR 糖度模型的预测相关系数为 0.980,验证均方根误差为 0.238。傅霞萍分别采用 USB2000 光谱仪以及傅里叶变换光谱仪在两种检测方式(漫反射和透射)下,对梨的品种进行定性分类分析。综合结果表明,用傅里叶变换光谱仪的InGaAS 检测器获得的近红外漫反射光谱的分类结果最佳。而且,她采用四种定量分析方法,偏最小二乘回归(PLSR)、主成分回归(PCR)、多元线性回归(MLR)及最小二乘支持向量机(LS-SVM)结合光谱预处理方法对翠冠梨的坚实度进行定量分析。刘燕德[21]采用近红外光谱无损检测技术,建立苹果和梨的糖度(Sugar content, SC)、总酸度(AT)以及有效酸度(PH 值)的线性和非线性数学模型。线性定量分析方法对苹果的预测标准偏差(RMSEP)分别为 0.530,0.043 和 0.006。梨的 RMSEP 分别是 0.543,0.239 和 0.132。 非线性定量分析方法采用矩阵误差反向传播 (Matrix Back Propagation,MBP)法,训练的优化匹配参数为:输入层神经元数目优化为 6,隐含层节点神经元数目为 4,采用非线性定量分析法(MBP)预测苹果的 SC、AT、PH 值,其标准偏差RMSEP 分别为 0.217,0.023 和 0.200。陆辉山采用近红外光谱透射方式采集夏橙的吸光度谱,分析在不同光源的情况下(100-500w)对夏橙 SSC 预测精度的影响。实验结果表明当光源为 400W 时,模型的预测精度最好,决定系数 R2 最大,RMSEC和 RMSEP 最小。马广等人等采用近红外光谱漫反射法检测金华大白桃的糖度,分析对比了不同部位果肉( 顶部、中部、底部)与其相应位置的果汁之间的相关性,结果表明: 大白桃 3 个部位检测点的果肉平均光谱和糖度平均值的模型精度比采用单个部位果肉建立的模型要好,在此基础上了对比分析了三种预处理方法(微分、MSC、SNV)对模型精度的影响,其中,微分预处理并没有改善模型的预测结果,经过 MSC以及 SNV 预处理后,模型精度明显提高。李艳肖等人对比分析了两种方法—遗传区间偏最小二乘法(GA-iPLS)和偏最小二乘法(PLS)预测苹果糖度的模型精度。结果表明,遗传区间偏最小二乘法校正集模型交互验证均方根误差 RMSECV 为 0.3346,预测集 RMSEP=0.3842,选取有效的光谱区间减少了波点个数,使得模型简单,运算量减少,所以基于 GA-iPLS 方法的建立的模型精度更高。赵杰文等人采用 PCR 和PLS 法研究苹果去皮前、 去皮后最大横径上四个点的近红外平均光谱和整个苹果的糖度值,结果表明,基于 PLS 法的带皮苹果检测的糖度是最可靠的。而且,基于苹果多测点平均光谱的模型精度较单测点光谱的精度高。

1.4 近红外光谱仪器概述
1.4.1 光谱仪器的基本构成

   光谱仪通常主要由 4 个系统构成: 光学系统、 电子系统、 机械系统和计算机系统,光学系统是光谱仪的核心技术。近红外光谱仪的光学部分由光源、分光系统、测样附件和检测器等功能部件构成,以下对光学系统各个功能部件进行介绍。

  (1)光源主要是为光谱仪器提供稳定能量的辐射,可分为线性光源和连续光源,卤钨灯是近红外光谱仪常用的光源,属于连续光源,性能稳定,而且价格相对较低。发光二极管 LED 是固定波长的线光源,线性度好,多用在便携式或在线仪器。

  (2)分光系统的主要功能是将复合光转化为单色光,即单色器。

  (3)测样附件主要是用来盛放待测的样本,依据待测样本的形态(固态、液态、气态),所适用测量附件的也有所不同。例如,液态样本多采用透射(反)式光纤探头或者透射式测量池,固态样品多用漫反射积分球或者漫反射探头。

  (4)检测器的功能是将辐射能转换为电信号进行检测,近红外光谱仪的检测器主要有两种:单点和阵列式检测器,Si 检测器或者 CCD 阵列式检测器多适用于短波近红外区域,PbS 或者 InGaAs 检测器多用于长波区域。InGaAs 检测器响应速度快,灵敏度以及信噪比高,但是价格较 PbS 高,PbS 的响应呈较高的非线。
 1.4.2 近红外光谱仪器的类型

  按单色器分类,NIR 光谱仪可分为滤光片型、光栅色散型、傅里叶变换型和声光可调滤光片型四类

  (1)滤光片型

  滤光片仪器采用干涉滤光片进行分光。 光学干涉滤光片是建立在光学薄膜干涉原理上的精密光学滤光器件,利用入射和反射之间相位差产生的干涉现象,得到带宽相当窄的单色光。此类仪器的优点是采样速度快、比较坚固,但是波长数目有限。

  (2)光栅扫描型光栅扫描型近红外光谱仪也称为色散扫描型,采用光栅作为分光元件,常用的紫外-可见光谱仪就采用的是光栅分光元件。光栅扫描型的光路如图 1.1 所示,光源发出的复色光束,经准直后通过入射狭缝,照射到光栅上,将复色光色散为单色光,从单色器出射的不同波长单色光的出射角不同, 通过转动光栅按照波长顺序依次通过出射狭缝,与待测样品发生作用后,到达检测器被检测。

     

 这类仪器的特点:结构不复杂,容易制造。与中红外光谱仪相比,由于近红外光谱仪可采用高能量的光源和高灵敏度的检测器,其信噪比相对较高。但仪器的分辨率较傅里叶变换型仪器稍差,波长的准确性也随之有所下降。更为重要的是,因光栅转动,为保证仪器的长期稳定性,需要进行特殊的设计考虑,对仪器的装配也有很高的要求。

 (3)声光可调滤光器(acousto optical tunable filter,AOTF)

  声光可调滤光器以双折射晶体为分光元件,采用声光衍射原理对光进行色散。AOTF 型近红外光谱仪的最大特点是分光系统中各部件均被固定,而且扫描速度快。AOTF 型仪器可以对任意长度的一组波段进行扫描,比较灵活,除此之外,它体积小、重量轻,属于小型化光谱仪。但是,与光栅扫描和傅里叶类型的仪器相比,分辨率不高,价格昂贵。

 (4)傅里叶变换型傅里叶变换型近红外光谱仪是 20 世纪 80 年代以后诞生的仪器, 在中红外光谱仪器的研发和制造基础上,主要是通过调整光源、检测器等,从而形成傅里叶变换型近红外光谱仪。其显著特点是,扫描速度快、分辨率高、波长准确度好。缺点:信噪比不高。

1.5 近红外光谱分析技术的特点以及局限性
1.5.1 近红外光谱分析技术的特点

 传统分析方法属于破坏性分析法,需要化学试剂,不仅分析速度慢,而且可能对环境造成污染,一般情况下,只能针对样本的单一组分或者性质进行分析。然而,近红外光谱分析法, 只需要对待测样本进行检测, 采集样本的特征光谱进行相应的分析,无需损伤样本, 可实现快速检测。 表 1.2 分别列出了传统分析法与光谱分析法的特点


1.5.2 近红外光谱分析技术的局限性
 近红外光谱技术的局限性主要表现在:
 (1)定量和定性分析几乎完全依赖于校正模型,校正模型往往需要针对不同的样品类型单独建立,需要消耗大量的人力及物力。
 (2)校正模型要求光谱仪器具有长期的稳定性,仪器的各项性能指标不能发生显著改变,光谱仪光路中任何一个光学部件的更换,都可能使模型失效。
 (3)在实际应用中,模型界外样本的存在,实验样本的组成或者性质的变动都会超出先前所建立模型的预测范围, 所以需要根据实际情况不断对校正模型进行扩充维护。
 (4)实验室型光谱仪一般为通用型光谱仪,测量附件(透射、漫反射、漫透射附件等)比较全面,性能指标如:分辨率、信噪比、光谱测量范围等相对比较高。但是,通用型光谱仪体积较大,而且试验参数设置比较繁琐,价格昂贵,不适用广大农民消费者在田间或者市场使用, 而且, 国内的便携式光谱仪基本都从国外进口, 所以,便携式或者手持式仪器的研制和应用在国内成为必然,有很大的发展潜力。
1.6 课题研究的主要内容
  本课题以葡萄为研究对象,采用近红外光谱仪采集葡萄的透射光谱,设计制作了便携式葡萄含糖量无损检测设备,克服了传统检测方法有损、效率低、不能实时监测的问题。葡萄含糖量检测仪操作简单,方便实用,无需设置性能指标等参数,达到了方便快捷的目的。本课题研究的主要内容是:
 (1)结合预处理方法分析蔗糖溶液的吸光度谱与蔗糖溶液浓度的相关性。实验采用 Avantes 近红外光谱仪采集蔗糖溶液的透射光谱,对比分析了 PLS 和 SVR 方法的建模精度。
 (2)分别在不同光程下采集不同浓度蔗糖溶液的吸光度光谱,结合 5 种预处理方法对不同光程下的光谱数据进行预处理并采用 PLS 方法建模,通过比较模型的评价参数来分析不同预处理方法消除光程差异的能力。
 (3)采用 Avantes 近红外光谱仪采集葡萄的透射光谱,结合预处理方法以及化学计量学定量分析法,分析葡萄的透射光谱与葡萄实际糖度的相关关系。
 (4)采用分光模块 USB2000+,型号为 LJD-eWin5S 开发板,光源,光纤,透射附件等材料设计便携式葡萄含糖量检测设备,编写调试基于 USB 口的葡萄透射光谱的采集程序,植入 smoothing,MSC 算法以及 PLS 定量分析方法。
 (5)验证葡萄含糖量检测仪的性能。采用手持式折糖仪、葡萄含糖量检测仪分别测量 20 颗葡萄的糖浓度,从响应时间、可重复性、预测精度三方面分析糖度检测仪的性能
2.1 近红外光谱检测技术
2.1.1 近红外光谱检测的基本原理

 近红外光谱技术就是利用有机分子的含氢基团(C-H,N-H,O-H)在近红外光谱区的倍频与合频吸收来分析分子的结构、状态等信息。C-H 基团各级倍频谱带的吸收强度如表 2.1 所示。当光照射到水果表面时,光就会与水果发生吸收、反射、折射、 透射等, 如图2.1所示。 水果与近红外光谱相互作用时, 水果样品的糖分子(C6H12O6)含氢官能团就会吸收光中某些频率波段的光,使光的能量减弱,检测光与水果作用后的吸收光谱或者透射光谱,因为光谱中携带了水果样本糖分的组织信息,提取水果样本糖分的特征光谱,结合化学计量学算法,就可以建立特征光谱与水果糖分的相关关系。
2.1.2 近红外光谱常规检测方法
  近红外光谱可以对液态、固态以及气态等多种类型的样品进行测量,但是,针对不同形态的样本,应该采取不同的测量方式。近红外光谱常规测量方法主要有两种:透射和反射,依据具体情况也可分为漫反射、漫透(反)射,透(反)射。
 (1)漫反射
 漫反射是最常见的近红外测量方式, 它适合于固态物质的测量, 例如谷物, 水果,土壤等。在漫反射过程中,光与实验样本内部分子发生多次反射、折射、散射及吸收等相互作用,而后又返回样品表面。漫反射不受样品的厚度及光路的影响,所以漫反射在获得样本组织结构信息方面更可靠。
 (2)漫透射
 对于浆状且含有悬浮物颗粒的液体,多采用漫透射或漫透反射测量。当一束平行光照射到粘稠状的液态样本时, 不仅包括样本对光的吸收外, 还存在光的色散, 因此,对这些样品进行透射分析时,成为漫透射。
 (3)透(反)射方式
 像汽油,白酒等这种均匀的流动性好的液态样本,透(反)射测量方式是最理想的方法。透反射与透射方式,原理相同,只是透反射在透射附件的后面放置了一组反射镜,使透反射检测方式的光程增加了一倍。对于透明的真溶液,透(反)射光谱法遵循朗伯比尔(Lambert-Beer)定律,但这一定律不适合于固态物质的漫反射。采用透(反)射方式同样能够提取样本的特征信息,但是该方法对光强的要求比较高。综合比较近红外光谱三种常规测量方式,由于葡萄颗粒小,质地均匀,而且采用透射方式能够获得较完整的特征信息,所以在本课题中,我们选用透射测量方式。
2.1.3 近红外光谱定量分析流程
 近红外光谱技术现在多用于样品的定性或者定量分析。 定性分析的主要是确定物质的组成与结构,或者按照某一指标对物质进行分类,而定量分析的目的主要是为了确定物质中一些成分的含量。
 近红外光谱定量分析的流程一般为: ① 校正集样本的确定以及样本光谱的采集;②传统方法测定样本某一成分的实际值(真值);③原始光谱的预处理;④异常样本的剔除及校正集模型的建立;⑤利用所建模型对未知样本进行预测。
 (1)校正集样本也称为训练集样本,校正集样本应该选取一定量具有代表性的样本,其待测指标范围(浓度范围)应该有较大梯度,大于预测集样本的浓度范围,这样能够保证模型的准确性。测试仪器的性能指标,确保仪器正常工作,设置光谱仪的相关参数(光谱范围、分辨率、采集方式、光程、测量附件等),采集所有实验样本的光谱,为数据分析做准备。
 (2)采用现行的标准方法或者常规测试方法检测校正集的真实值,校正集样本的光谱以及相对应的真实值共同组成校正集,用于建立模型。
 (3)由于周围环境差异、仪器状态不稳定等因素对建模结果的影响,有时候有必要采用光谱预处理方法(平滑、多元散射校正、归一化等)对校正集光谱进行预处理。
 (4)结合定量分析方法(线性或者非线性)建立初始校正模型,剔除异常样本,并且反复选取不同的参数(波长范围、预处理方法、主因子数等),建立最优模型。
 (5)采用建立的校正集模型对未知样本(预测集样本)的光谱进行分析,预测出未知样本的相应的指标,与未知样本的真值进行比较,分析模型性能。
2.2 近红外光谱数据处理及建模方法
2.2.1 近红外光谱数据预处理方法

 光谱采集的过程中,由于仪器状态不稳定,周围环境差异[29],样品背景等因素的影响,使得光谱中包含了一些非样品本身的化学信息,即随机误差,所以,在建立模型之前,有必要采用光谱预处理方法,减少或者消除无关信息或者噪声对模型精度的影响。常用的光谱预处理方法有:平滑(smoothing)、归一化(normalization)、基线偏移校正、多元散射较正(MSC)、标准正态变量变换(SNV)、导数等。
 (1)平滑
 Smoothing 的作用是为了消除高频随机误差、提高信噪比。常用的平滑方法有窗口移动平均法、Savitzky-Golay 卷积平滑算法,二者相同点都是消除或者减弱样品光谱中的高频随机噪声。不同点是:移动平均平滑方法是采用平滑窗口内所有波长点测量值的平均来代替窗口内中心波长点处的测量值,窗口内的波长点个数总为奇数。其方程式
 所以,平滑窗口宽度的选择至关重要,窗口过大或者过小,都会使得模型性能不理想。
 Savitzky-Golay 卷积平滑法也称多项式平滑法,其实质是通过多项式来对移动窗口内的数据进行多项式最小二乘拟合, 移动窗口宽度对光谱信号的影响小于移动平均平滑法。其方程式为:
(2)归一化(normalization)
  归一化可以用来校正微小光程差引起的光谱变化, 归一化算法包括: 面积归一化、最大归一化、平均归一化、矢量归一化等,应用较多的是矢量归一化,算法如下:
 (3)基线偏移校正(baseline offset correction,BOC)
   基线偏移校正的算法公式如下所示:
其中, xk 代表其中的一条光谱, X 表示所有样本的光谱,所有的光谱都减去同一条光谱(光谱值最小的光谱) ,确保最小光谱值为 0,其余的光谱值都是正的。
(4)多元散射校正(multiplicative scatter correction,MSC)
  固体物质的漫反射以及浆状、透明物质的透(反)射,经常会采用多元散射校正法来消除光程差异、基线漂移、干扰噪声等对光谱的影响。它是基于一组样品光谱阵列的散射校正技术,下面以一条光谱为例,多元散射校正法的实质是对一条原始光谱x (1×n)以及校正集样本的平均光谱 x 进行线性回归分析,通过最小二乘法求出参数 a和b ,然后对原始光谱进行修正,其具体算法如下:
  采用 MSC 算法的前提条件是假设散射是在一定波长,固定样品浓度下进行的,所以,针对样品浓度特性变化范围较大的光谱进行处理时,结果较差。
 (5)标准正态变量变换(standard normal variate transformation, SNV)
  标准正态变量变换通过对光谱(基于光谱阵的列)进行中心化以及加权运算,来减弱样本表面散射、光程差异等的影响,其实质是对光谱阵列进行标准正态变换,使得光谱阵的均值为 0,方差为 1。SNV 预处理方法的效果类似于 MSC 方法,不同之处是 MSC 方法是对一组光谱阵进行预处理。SNV 变换的公式如下:
(6)微分法
  一阶微分、二阶微分法是光谱预处理中经常采用的方法,一阶微分法的实质是光谱上任意两点所在直线的斜率,因为斜率不受光谱的基线偏移的影响。二阶微分法描述的是斜率曲线的变化趋势,它不仅可以消除基线偏移,而且可以平滑光谱,减弱光谱中的巨齿现象,优化光谱特征。常用的两种微分法是Norris-Gap差分法和Savitzky-Golay卷积法。
① Norris-Gap 差分法的原理是:以5点平滑,3点差分宽度为例,首先采用窗口宽度为5的移动平均平滑法对光谱进行去噪处理, 然后再采用宽度为3点的直接差分法对光谱进行微分处理。
② Savitzky-Golay 卷积求导法是基于最小二乘拟合原理。通过最小二乘法得到一系列微分系数。该方法比较适用于波长采样点比较稀疏的光谱,而且误差较小。采用微分法对光谱进行预处理时,窗口宽度的大小决定了最终的去噪效果,窗口宽度过大或者过小,均会失去一些重要的特征信息。
 除了以上介绍的5种预处理方法以外,傅里叶变换(Fourier transform, FT),小波变换(wavelet transform, WT)以及正交信号校正(Orthogonal signal correction, OSC)也是我们经常采用的预处理方法。
2.2.2 近红外光谱常用定量分析方法
  朗伯-比尔定律描述的是当一束平行单色光垂直通过均匀非散射吸光物质时,物质的吸光度 A 与光程l 以及溶液的浓度 c 之间的相关性。公式为:
 I0为入射光的强度,It为透射光的强度,T为透过率,K是吸光系数,由公式可知,吸光度A与物质的浓度c,吸收层的厚度(光程)l成正比。
 Lambert-Beer定律是光谱定量分析的理论依据,但是该定律是在一定的理想条件下(入射光为单色光,忽略吸光分子间的相互作用)才能成立。但是,我们实际的研究对象都是样本特征比较复杂的物质, 采集到的光谱信息容易受到样本内部其他成分的干扰,所以,我们应该采用相应的定量分析方法对光谱进行建模分析,不仅可以消除干扰对光谱的影响,而且能够充分利用光谱中的有用信息,从而提高模型精度以及重复性。常用的定量分析方法有:多元线性回归法(Multi-Linear Regression,MLR),主成分回归(Principal Components Regression,PCR),偏最小二乘法(Partial LeastSquares,PLS)、支持向量回归(Support Vector Machines Regression,SVR) 。其中,MLR、PCR、PLS是基于线性回归方式的多元校正方法,具有线性加和性。SVR属于非线性定量分析,因为有些研究对象具有明显的非线性特征,这种情况下,只有采用非线性校正模型,才能获得理想的结果。
(1)多元线性回归

  多元线性回归方法与一元线性回归方法类似,只是数据量较大,比较适用于线性关系比较好的体系中,而且忽略组分间的相互干扰。多元线性回归方法的因变量与自变量的关系如下: y  Xb   , X 矩阵代表光谱矩阵,y 代表样本的实际浓度值,通过最小二乘法求得系数矩阵b  X T X 1 X T y 。早期近红外光谱分析中常采用多元线性回归法进行定量分析。MLR适用范围较小,其一是因为,参与回归的校正集样本的变量数必须小于样本的个数,其二,MLR不考虑光谱矩阵 X 之间的相关性,无法消除 X 矩阵中的噪声,导致过度拟合情况的发生,使得模型的精度下降。

 (2)主成分回归

  主成分回归法的实质是主成分分析(principal component analysis,PCA)法和多元线性回归(MLR)法的结合使用。主成分分析法的主要目的是对光谱矩阵 X 进行降维,用少量的线性无关的新变量代替原变量,而且新变量能够反应原变量的主要特征。 PCA将光谱矩阵 X(n×m) 分解成m个向量的外积之和, 即:X  TPT , T  t1t2tn为得分向量, P  p1 p2 pn为载荷向量,每个得分向量的实质是光谱矩阵 X 在其对应载荷向量方向上的投影,载荷向量相当于从混合体系中分离出来的“独立组分”的光谱,对应的得分向量对应于该组分的在不同样本中的权重。

 由PCA方法计算得到的得分向量T 代替光谱数据进行MLR, 可得到主成分回归模型 y  Tb  E ,由最小二乘法可得到回归系数b  (T TT)1T T y 。主成分回归法可应用在研究对象比较复杂的体系中,因为此方法可以消除光谱矩阵中的干扰信息,保留有用的光谱信息,从而提高模型的预测精度。但是该方法较MLR计算速度慢。

 (3)偏最小二乘法

 PLS 法是目前应用最为广泛的定量分析方法,其主要思想是:PLS 能够同时对光谱矩阵 X 和浓度矩阵 y 进行分解,消除二者中的干扰信息,提高模型预测精度。而PCR 方法只考虑了光谱矩阵 X 中的干扰信息。MLR 方法计算比较简单,比较适用于待测样本组分比较简单的体系,PCR 能够对光谱矩阵 X 进行分解,消除光谱的共线性、干扰等因素的影响,与 MLR 方法相比,模型的性能得到显著提高。PLS 方法是充分考虑 X 矩阵和 y 矩阵的相关性,将数据分解与回归融合在一起,所以,PLS 是MLR 以及 PCR 方法的完美结合。

(4)支持向量回归(support vector regression,SVR)

  支持向量回归方法是通过核函数进行非线性变换将原问题转化到某个高维空间,然后进行线性求解。SVR的特点:针对有限个实验样本信息寻求最优解。在大部分研究中往往应用多种定量校正方法建立模型,通过对建模结果(相关系数、预测误差、模型稳定性等)进行比较后,得出较佳的方法。迄今为止没有一种方法在任何条件下都能取得最佳效果,对不同样品,各种方法有其不同的适用性。

2.2.3 模型的验证与评价标准

 校正集样本所建立的模型的优劣以及对未知样本的预测结果是否理想, 需要一些相关的统计参数进行评价,如:相关系数或决定系数、校正标准偏差、交互验证标准偏差以及预测标准偏差,交互验证标准偏差是用来衡量校正集模型的预测精度,预测标准偏差是用来对所建模型的准确性、重复性进行验证。

 (1)相关系数R或者决定系数R2

 相关系数是研究变量之间线性相关程度的量, 它表示的是一种非确定[34]的相关关系。相关系数R的公式如下:

 xi, yi,(i = 1,2,...,n) 为变量 x , y 的样本值, x, y 为两个变量样本值的平均值,n 为变量样本值的个数。 R 的取值范围是: -1≦R≦1。 R=1, 表明变量之间全相关, 若 R≈0,表明变量之间没有相关性。在光谱分析中,相关系数主要应用在表示化学计量学方法分析后的样本的预测值与样本的真实值之间的相关性。

 (2)校正标准偏差(root mean square error of calibration,RMSEC)

 

 yi,actual 代表编号为i 的样本用参考方法测量的真实值,yi, predicted 为校正集样本所建立的模型对校正集样本i 的预测值。

 (3)交互验证的校正标准偏差(root mean square error of cross calibration,RMSECV)

     

 yi,actual 代表编号为i 的样本用参考方法测量的真实值,yi, predicted 为校正集样本交互验证方法对校正集样本i 的预测值。

 (4)预测标准偏差[28,29,35](root mean square error of prediction,RMSEP)

 yi,actual 为预测集样本中样本i 的参考测量真实值,yi, predicted 为预测集样本预测过程中,样本i 的预测值, m 为预测集样本的个数。

 模型优劣的评价标准是,R 或者 R2 越接近 1 越好,RMSEC,RMSECV 越小越好,而且一般情况下,RMSECV 都略大于 RMSEC,当以上条件都满足时,说明校正集模型的精度比较高;RMSEP 越小,表明预测结果越准确,所建立的校正集模型性能更优。

3.1 基于短波近红外光谱的蔗糖浓度测量方法研究

  蔗糖是自然界分布最广的非还原性二糖,食品的主要甜味剂,可用于制葡萄糖和果糖,能够为生命过程提供所需能量,同时可以增强人体的免疫力。糖的分析方法有酶比色法[3]、高效液相色谱法[30]和离子色谱法[31]等,这些方法操作时间较长、费用较高,不适于在线分析。我们采用无损、快速的近红外光谱技术检测蔗糖溶液的浓度。

  本小节旨在寻找一种快速、准确的方法来检测溶液中蔗糖的含量,研究近红外测量中的光谱预处理方法, 为后续的葡萄中糖分的测定奠定基础。 研究要完成的目标有:①通过近红外透反射光谱技术在线检测溶液中的蔗糖; ②建立蔗糖溶液的在线预测模型;③采用两种建模方法对预测集样本浓度进行预测,选择最优建模方法。

3.1.1 实验

 (1)实验材料及设备蔗糖 400g,用纯净水配制 60 个样本溶液(浓度范围:0~30%),蔗糖溶液样本用 500mL 烧杯盛装,溶液定容到 300mL。实验样品:校正集 48 个,预测集 12 个。

  实验采用近红外光谱仪( AvaSpec-2048, Avantes, Netherlands)采集蔗糖溶液的透反射光谱。糖度计为海鸥光学公司生产的 ATC 型手持折糖仪[37](0~32%),自带温度补偿装置,补偿范围为 10℃~30℃,最小刻度值为 0.2%。

 (2)糖浓度值测量

  用胶头滴管量取少许配置好的蔗糖溶液, 滴在 ATC 型手持折糖仪棱镜表面中央,迅速关上辅助棱镜,静置10s,调节目镜视度圈,使视野内出现清晰明暗分界线。分界线相应的读数即蔗糖溶液的浓度值。 测量不同样本之前, 应用清水冲洗棱镜表面,保持棱镜表面的清洁。

 (3)光谱测量本文采用 Avantes近红外光谱仪的浸入式透反射光纤探头,光源为石英卤素灯12W/12V,检测器为 2048 像元线性阵列 CCD 检测器,其中光谱仪采集的光谱范围为300~1100nm,CCD 积分时间为 45ms, 扫描次数为25, 平均值设为10,透射光程为10mm。如图 3.1 所示,将光纤探头朝下固定在光纤支架上并浸入到配置好的溶液中,光源输出的光透过溶液打到镜面上,经镜面反射回输入光纤内,至探测器。实验在自行设计的密闭环境中进行,对不同浓度蔗糖溶液的吸光度进行测量,以纯净水为背景进行背景光谱的采集。

  其中 samplen 是蔗糖溶液样品的透反射光谱的光强值, darkn 是当光源关闭时探头直接照射水中得到的光强值,refn 是光源打开时探头照射水中得到的光强值

3.1.2 光谱的优化

  原始光谱在采集过程中可能由于样本溶液不均匀、 光谱仪工作不稳定和环境温度的影响等因素,导致谱图基线漂移和平移等现象,本文选取 780~1100nm 波段范围内溶液的短波近红外吸光度谱, 原始光谱如图 3.2 所示 (随着蔗糖溶液浓度的递增,溶液的吸光度值增大)。所以在建模之前,需要对原始光谱进行适当的预处理。本文采用 Camo 公司 The Unscrambler 9.7 软件对原始光谱的校正集和预测集分别进行
Savitzky-Golay(S-G)卷积平滑和 MSC 校正。(S-G)平滑方法可去除光谱信号中高频噪声的干扰, 若平滑点数太少,去燥效果将不佳,平滑点数过大,有可能造成光谱信号的失真。经过大量实验之后,本文选择平滑点数是 5,能达到有效去除高频噪声的目的。MSC 主要用来消除样本不均匀、散射以及光程差异对光谱的影响[39]。对原始光谱依次进行(S-G)卷积平滑和 MSC 预处理后,有效的消除了原始光谱中的散射、漂移等噪声。预处理后的光谱如图 3.3 所示。

3.1.3 校正集模型的建立

   偏最小二乘(PLS)和支持向量机回归(SVR)是两种不同的定量分析方法,PLS是目前广泛使用的线性定量分析法,它能够对光谱矩阵以及浓度矩阵进行处理,消除其中的无用信息;SVR是非线性定量分析方法,能够将非线性问题转化为线性问题求解

  本文选用 44 份蔗糖溶液样本,利用 Camo 公司的 Unscrambler 9.7 软件对手持折糖仪测得的蔗糖浓度与校正集吸光度数据进行相关性分析,使用PLS和SVR 建立校正模型,模型的最佳主成分个数由交互验证(cross-validation)确定。两种建模方式下蔗糖溶液交互验证的预测值和真实值的对应关系如图 3.4、图3.5所示, 其中校正集的 RC,RCV ,RMSEC,RMSECV,PC 如表 3.1 所示。


  由图 3.4,3.5 所示,横坐标是蔗糖溶液的真值,纵坐标是校正集交互验证后的蔗糖溶液的预测值,图中的坐标点都紧紧围绕在拟合的直线附近,而且直线的斜率分别是 0.98629,0.76899,采用 PLS 建模以后的拟合的直线斜率近似等于1。由表 3.1可知,SVR 模型的 RC,RCV 分别为 0.895,0.841,相关系数均在 0.90以下,校正标准偏差 RMSEC,RMSECV 分别为 0.02684,0.03620,均在 0.20%以下,然而,PLS 模型的相关系数高达 0.98,校正标准偏差均在0.11%以下,所以 PLS 模型的预测精度更高,而且,与 PLS 模型相比,SVR 模型需要将非线性问题转化为线性问题求解,增加了运算量,模型相对比较复杂,所以,综合以上结果,采用 PLS方法建模比 SVR 方法的预测精度更高。

3.1.4 溶液糖分校正模型的预测能力验证

 用已建立的数学模型(SVR、PLS)对 12 个预测集样品(经过预处理后)的糖度进行预测,预测样品的浓度范围:11.2%~27.2%,两种预测模型预测标准偏差 RMSEP,12个预测样品的真实值、预测值及相对误差如表3.2所示。

  由表3.2 可知,SVR和PLS模型的 RMSEP 分别是0.037,0.0116 ,PLS 模型的RMSEP 小于 SVR 模型;在低浓度时(20 %以下) ,两种预测方式的预测精度都不高,SVR 模型的预测集样本中 67%的样本的相对误差在 5 %以内,而PLS模型的预测结果中80%的样本的相对误差在 5 %以内。所以,综合以上结果可知,用近红外光谱透射法检测蔗糖溶液的浓度是可行的,而且采用PLS建模的精度更高。

3.2 蔗糖溶液光谱测量中的光程变化误差消减方法研究
3.2.1 实验

 (1)实验材料及设备

  蔗糖, 用纯净水配制 78 个样本溶液 (浓度范围: 0~30%), 蔗糖溶液样本用 500mL烧杯盛装,溶液定容至 300mL。实验样品分成校正集和预测集,校正集样本 62 个,预测集 12 个。

  实验采用近红外光谱仪( AvaSpec-2048, Avantes, Netherlands)及其透反射附件进行光谱的采集,光源为石英卤素灯 12W/12V,2048 像元线性阵列 CCD 检测器。糖度计为海鸥光学仪器厂生产的 ATC 型手持折糖仪(0~32%),最小刻度值为 0.2%。内部带有温度补偿装置,补偿范围 10℃~30℃。

 (2)糖浓度值测量测量仪器:

 ATC 型手持糖度计,测量方法如同 3.1.1 实验部分的描述。

 (3)光谱测量

  实验以空气为背景,为避免光程太小,光谱携带的信息太少[41,42],所以分别在4mm,5mm,6mm 光程下测量不同浓度蔗糖溶液的吸光度,实验采用可调光程的透反射浸入式光纤探头,通过调节反射镜距离光纤末端的距离,实现光程的调节,实验原理图如 3.6 图所示。采用光谱仪配套的 Avasoft 7.6 软件采集样品的近红外透反射光谱。光谱采集范围为 780~1100nm,CCD 积分时间为 45ms, 扫描次数为 25, 平均次数为 10,三组相同浓度(11%,20%,24%)的样本在不同光程下的光谱如图 3.7 所示。随着光程的增加,相同浓度的蔗糖溶液的吸光度值递增。

3.2.2 误差消减方法对预测结果的影响分析

  分别采用 normalization、基线偏移校正、MSC、SNV、一阶导数 5 种预处理方法对原始光谱进行预处理,并且对原始光谱、预处理后的光谱进行 PLS 法建模。预处理后的光谱如图 3.8~3.12 所示

  本文采用偏最小二乘法(PLS)对多光程下经 5 种预处理方法校正后的光谱以及原始光谱分别进行建模分析,建模结果如表 3.3 所示。模型的最佳主成分个数由交互验证(cross-validation)确定,主要从决定系数(R2,R2cv),校正标准偏差(RMSEC),交互验证的校正标准偏差(RMSECV)来对校正集模型进行评价

  与原始光谱相比, 5 种预处理方法均对模型的预测精度都有不同程度的提高, R2,Rcv2 都大于 0.9,RMSEC,RMSECV 也都小于 1.7。5 种预处理方法中,vectornormalization 的建模结果相对最差,MSC 的预测精度最高,稳定性最好,R2,Rcv2都在 0.983 以上;而且 RMSEC,RMSECV 很小,二者的差值最小等于 0.16。SNV,BOC 以及 First derivative 的模型性能都略差于 MSC,可能是因为经过 SNV 处理后,光谱吸光度明显比原始光谱高,导致模型预测精度下降,First derivative 的预测结果R2=0.988033,Rcv2=0.980930,都在 0.980 以上,但是二者差值相对比较大,模型的稳定性不好,可能是因为在减弱和消除光程差异对光谱影响的同时,引入了噪声,使得光谱不够平滑。

3.2.3 溶液糖分回归模型的预测能力验证

  分别采用已建立的原始光谱 PLS 回归模型和 MSC 预处理后的 PLS 回归模型对16 个预测集样本进行预测,预测样品的浓度范围:10%~26%。样本的预测值和真实值的对应关系如图 3.13,图 3.14 所示。原始光谱的 PLS 模型的预测结果为:预测标准偏差 RMSEP=0.01436,相关系数 R=0.95089。MSC 预处理后的 PLS 模型的预测结果:预测标准偏差 RMSEP=0.01,相关系数 R=0.97622。图 3.13 中只有极少数的点在位于拟合的直线上,大部分的点都分散在拟合直线的周围,图 3.14 中则恰恰相反,较多的点位于拟合直线上。综合以上结果,说明采用 MSC 预处理能够消除光程差异,得到与光程无关的等效光谱,从而提高模型的预测精度,改善模型的稳定性。

  小结:3.1 节结合化学计量学方法(PLS,SVR)验证了短波近红外波段无损检测蔗糖溶液浓度的可行性,其中 PLS 方法建模结果比较理想,而且与非线性建模方法相比,模型简单。3.2 节采用不同的预处理方法消除光程差异对光谱的影响,并结合 PLS 方法建模,其中 MSC 方法预处理效果最好,与原始光谱 PLS 建模相比,明显提高了模型的预测精度。3.1,3.2 节充分对短波近红外光谱蔗糖浓度的快速无损检测的可行性进行了验证。

3.3 基于 PLS 法的短波近红外光谱葡萄含糖量透射测量方法研究
3.3.1 实验

 (1)实验材料及设备

  新鲜巨峰葡萄 50 颗,大小均匀,不同颜色(青色、红色、深红色)的葡萄都包括在内,实验前需要将葡萄表皮清理干净,并对样本进行标记处理。实验样本分为校正集样本 40 颗,预测集样本 10 颗。

 糖度计:ATC 型手持式折糖仪(0~32%)

  光谱仪:Avantes 公司的 ULS2048*114-USB2 光纤光谱仪。

 (2)糖度值测量实验采用破坏法,划破葡萄果皮,取少量葡萄汁液滴在折糖仪棱镜表面,轻微晃动折糖仪,使得汁液均匀遍布折光仪棱镜表面,迅速关上辅助棱镜,静置 10 秒,朝向光源处,调节目镜,视野内出现清晰的蓝白分界线,分界线相应的读数即为葡萄汁液的糖浓度。测量不同的样本前,保持糖度计表面清洁。

 (3)光谱的测量如图所示,连接实验设备,将标记好的葡萄样本至于透射附件上,打开光源预热1min,采用 AvaSpes-2048 光谱仪配套的软件采集葡萄的透射光谱,光谱仪的积分时间为 300ms,平均值为 11,光谱仪扫描的波长范围为 300~1100nm。葡萄透射检测的原理图如 3.15 所示:

3.3.2 光谱的优化及校正集模型的建立

 (1)光谱的优化

  葡萄的透射光谱如图 3.16 所示,由于葡萄大小差异,果皮反射,以及葡萄内部籽粒的影响,会导致透射光程存在差异,使得透射光谱出现明显的漂移,光谱漂移会导致模型精度不高,所以,有必要采用一定的预处理方法对光谱进行预处理,提高模型的预测精度。选择短波近红外波段 780nm~1050nm 的光谱,分别采用 5 点 S-G平滑, smoothing+MSC, smoothing+SNV, smoothing+baseline 对原始光谱进行预处理,预处理后的光谱图如图 3.17(a~e) 所示,对原始光谱以及预处理后的光谱进行 PLS建模,建模结果如表 3.4 所示。


 

 平滑 smoothing预处理,消除了光谱中的包含的噪声,光谱变得平滑,但是光谱偏移现象明显存在;Smoothing+normalization,Smoothing+baseline 消除了部分光程差异对模型精度的影响,其中,Smoothing+MSC,Smoothing+SNV 两种方法的预处理结果最好。

  由上表可知,原始光谱 PLS 建模的模型精度最差,原始光谱经过预处理后,校正集模型的性能都有一定程度的提高,其中,Smoothing+MSC 预处理,建模结果最好,RCV2=0.890075,RMSECV=0.03292,只经过 smoothing 处理后的,模型性能指标最差。

3.3.3 葡萄含糖量校正集模型的预测能力验证

  分别采用已建立的原始光谱 PLS 回归模型和 smoothing+MSC 预处理后的 PLS 回归模型对 10 个预测集样本进行预测,预测样品的浓度范围:15%~19%。样本的预测值和真实值的对应关系如图 3.18,3.19 所示。原始光谱的 PLS 模型的预测结果为:RMSEP=0.1328,R=0.60521。Smoothing+MSC 预处理后的 PLS 模型的预测结果:RMSEP=0.0814,R=0.81897。综合以上结果,采用 PLS 结合 smoothing+MSC 预处理后的光谱能够减少光谱中的噪声信息,从而提高模型的预测精度,改善模型的稳定性。

           

                               基于近红外光谱的葡萄含糖量检测仪的设

4.1 整体设计思路

 按照功能、用途以及体积大小等不同,可将光谱仪器分为实验室型光谱仪器,便携式光谱仪器,在线仪器。实验室型仪器一般体积较大,自带的附件比较完备,能够满足多种类型样品的测量,对仪器的性能指标要求比较高。便携式光谱仪器相对实验室型仪器体积小,重量轻,对外界环境(温度、湿度)的适用范围更宽。在线型光谱仪器包括光谱仪,测量附件,取样以及数据处理系统,数据通信模块等,针对不同的测量体系,在线近红外光谱仪的复杂程度也不尽相同。

  近红外光谱葡萄糖分检测仪属于便携式检测仪,体积相对较小,重量轻。仪器包含型号为H02可调钨灯光源,USB2000+分光模块,光纤,透射附件,基于Win CE系统LJD-eWin5S控制平台,总体设计如图4.1所示。系统控制平台通过控制分光模块USB2000+采集葡萄的透射光强, 经过USB-Host端口传输到LJD-eWin5S控制平台显示存储,采用PLS算法对短波近红外波段(800~1050nm)的透射光强进行运算,得到葡萄的糖浓度,在液晶屏上显示。葡萄含糖量检测仪器如图4.1所示。

4.2 硬件电路的设计

  硬件电路的设计主要是对可调钨灯光源, 分光模块USB2000+, 光纤以及基于WinCE系统的LJD-eWin5S控制平台的性能指标进行详细的介绍。
4.2.1 光源的选择

  激光、发光二极管和热辐射光源是近红外光谱广泛采用的光源,热辐射光源可分为白炽灯和卤钨灯,是非相干光源,具有连续的发射光谱,波长范围较宽,卤钨灯也是白炽灯的一种,卤钨灯的特点是在灯泡内注入碘或溴等卤素气体,这些气体在灯泡内建立了卤钨循环。灯丝中挥发出来的钨在灯泡内扩散,并且与卤素进行化学反应生成卤化物;卤化物极不稳定,在高温情况下,卤化物又会分解,释放出钨和卤素气体,钨会重新凝固在钨丝上,形成平衡的循环,所以卤素灯泡的寿命较白炽灯长。因为卤钨灯的管壁温度很高。所以必须使用耐高温的石英玻璃或硬玻璃。

卤钨灯具有体积小、发光效率高、色温稳定、几乎无光衰、寿命长等优点。本文采用杭州赛曼科技有限公司推出的光纤耦合可见/近红外光源—可调钨灯光源 H02,其外观如图4.2所示。 光源覆盖波长范围330nm~2000nm。 在可见/近红外波段采用10W钨灯。DC12V 电源直接供电,整体性较强,而且是透射及吸收光谱测量的最佳选择。其性能参数如下表所示:

 与其他种类的光源相比, 卤钨灯的缺点是辐射出来的热量很大。 不能有利回收,具有污染。

4.2.2 分光模块的选择

  单点检测器和阵列检测器是近红外光谱仪广泛采用的两种检测器, 短波区域多采用 Si 检测器和 CCD 阵列检测器。型号为 H02的可调钨灯光源发出的光透过葡萄,其透射光谱已携带了葡萄的糖分信息, 探测器的主要任务就是实现对葡萄透射光谱的采集和存储。本文采用 Ocean optics 公司生产的 USB2000+分光模块对葡萄透射光谱进行采集,是一种具有高光谱响应以及高光谱分辨率的模块。

 USB2000+分光模块是一个具有高度集成性、灵活性的仪器,分光模块外观如图4.3所示。分光模块内置了2048像元的线性 CCD 阵列检测器和 USB2.0,RS232接口,3MHz 的 A/D 转换器,可编程电子元件等。而且通过 USB2.0,RS232接口与 PC 机、PLC 以及其他嵌入式控制器进行通信。当通过 USB 口跟计算机连接时,分光模块直接由计算机供电,不需要额外的电源供电。

(1)探测器
 USB2000+分光模块的内置探测器选用的是索尼公司的一款高灵敏度,像素为2048的 CCD 线性阵列探测器,产品编号为 ILX511,ILX511是一个长方形的衰减型的CCD 线性图像传感器,专为 POS 条形码手持式扫描仪和光学测量设备的使用。内置时序发生器和时钟驱动器,5 V 单电源供电。

(2)通信接口
  USB2000+的通信接口包括:USB2.0,RS232。

  通用串行总线 USB,传输速率可达 480-Mbit,能够进行超快速的数据传输,主要的是与 PC 机进行通信。当 USB2000+与 PC 机通信时,不需要额外的电源供电,分光模块直接由计算机供电。USB2000+采用 Cypress 公式生产的 FX2 系列芯片CY7C68013 微处理器,其内置 USB2.0 专用集成电路,包含增强高速内核 8051,16K内部存储器和 64K 的外部存储器,FX2 系列的 CY7C68013 微处理器将 USB 端点的FIFO 与外设的 FIFO 合二为一,实现了与外设的“胶连接” ,大大提高了端点 FIFO与外设的交换速度。

 RS232 串口通信,也被称为是 PC 机和工业设备的标准通信接口。当发送和接收信号时,USB2000+作为一个独立的设备,它可以将数据输出到其他逻辑器件/控制器(如 PLC)或微控制器。USB2000+在 RS-232 模式下运行时,需要一个外部的5伏电源供电。

4.2.3 蓝海微芯开发板的介绍

  本课题采用蓝海微芯科技发展有限公司开发的型号为LJD-eWin5S的开发板进行仪器的控制和采集,LJD-eWin5S是一款基于Windows CE操作系统下的控制平台。它拥有32位ARM920T 高速处理器内核。主要用于可控制系统平台上的人机界面。适合工业控制、医疗仪器、监控测试、智能设备、智能家居,移动或车载系统等。LJD-eWin5S 可以基于 EVC或是Visual Studio 2005来开发,本课题是基于VisualStudio 2005环境下进行开发的, 采用C++进行编程, LJD-eWin5S开发板的外观如图4.4(a)、(b)所示。

 LJD-eWin5S 产品的主要性能参数如下表所示:

 LJD-eWin5s 通过 USBHOST 端口与 USB2000+分光模块建立通信如图 4.5 所示,实现葡萄透射光谱的采集。除此之外,微软开发的一款 Microsoft ActiveSync 同步软件,在 PC 机上运行,它通过 USB DEVICE 端口将 eWin5s 与 PC 机链接,能够进行文件传输和应用程序开发/调试,所以我们也可以通过 Microsoft ActiveSync 同步软件将采集到的光谱数据转移到 PC 机上,进行数据分析。

4.2.4 光纤

  光是一种电磁波, 是用来传输光波的纤维, 光谱在线仪器大都采用光纤来传输。它可以在困难条件下或危险环境下以及复杂的工业生产现场进行工作, 从而使光谱仪远离测量点。光纤使得光谱仪的设计、制造和安装变得极为方便。光纤通常是三层圆柱状媒介,内层为纤芯,外层为包层,在包层外面还有一层保护层如树脂图层,光纤内部结构示意图如4.6所示。光纤利用光的全反射(全反射:光从光密介质射向光疏介质时, 当入射角超过某一角度—临界角时, 折射光完全消失,只剩下反射光线的现象)的原理把光约束在其界面内,并引导光波沿着光轴线的方向前进,它的传输特性由其结构和材料决定。

 按照传输模式分类,光纤可分为多模光纤和单模光纤: “模”是指以一定角速度进入光纤的一束光。多模光纤是指多束光在光纤中传播,从而形成了模分散(模分散:不同的光束因为进入光纤的角度不一致,所以在光纤中传播的时间也不同,到达光纤另一个端点的时间也不一致,这种现象成为模分散),多模光纤又可分为梯度型、阶跃型两种。单模光纤是指只有一束光穿过光纤。因为单模光纤中不存在模分散的情况,所以单模光纤的数据传输质量高,传输速度快,芯线较细,损耗小,适合容量大,远距离传输;多模光纤受模分散的影响,使得光纤的芯线直径大,适合速率低,短距离的传输。

  按照光纤材质分类,光纤可分为石英光纤,塑料光纤以及红外光纤。石英光纤以二氧化硅(SiO2)为主要原材料,通过调节掺杂量,来控制纤芯和包层的折射率分布的光纤。塑料光纤的纤芯以及包层都是用塑料(主要原料:有机玻璃、聚苯乙烯和聚碳酸酯)制成的。红外光纤(Infrared Optical Fiber) ,主要用于光能传送。多应用在热图像传输、激光手术刀医疗等方面。塑料光纤,容易弯曲,柔韧性较强,适合安装在机械结构上,红外光纤是在石英系列光纤的基础上开发出来的,传输距离短。与塑料光纤以及红外光纤相比,石英光纤具有低消耗、带宽的优点,具有一定程度的抗冲击,抗振动能力,同时还可以抗电磁干扰。

 本文采用 Avantes 公司的标准型光纤,属于折射率阶跃型多模光纤,光纤纤芯由纯度很高的石英材料制成,光纤涂层由低折射率的掺氟的石英材料制成,而且该光纤只有 20cm 长,传输距离短,光信号损耗较弱

4.2 系统软件设计
4.2.1 数据采集模块软件设计

 LJD-eWin5S 开发板通过 USB-Host 口与 USB2000+分光模块连接,12V 电源给LJD-eWin5S 开发板供电以后,LJD-eWin5S 以及 USB2000+开始工作。USB2000+分光模块采集葡萄透射光谱 (300nm~1100nm), 经过 USB-Host 端口传输给 LJD-eWin5S保存并显示。数据采集程序的设计采取模块化的设计方法,主要包含的函数有:打开USB2000+分光模块函数;分光模块类型获得函数;设置积分时间函数;采集光谱函数;关闭 USB2000+分光模块函数。

 (1)打开分光模块函数:

  函数名称:seabreeze_open_first_spectrometer

  功能:打开分光模块 USB2000+

 (2)分光模块类型获得函数函数名称:seabreeze_get_spectrometer_type

  功能:这个函数返回一个字符串表示分光模块的类型

 (3)设置积分时间函数:函数名称:seabreeze_set_integration_time

  功能:设置积分时间

 (4)采集光谱函数函数名称:get_spectrum_test;

  功能:采集葡萄的透射光谱

 (5)关闭分光模块函数函数名称:seabreeze_close_spectrometer

  功能:关闭分光模块 USB2000+

 光谱采集程序的流程图见图 4.8,采集到的葡萄透射光谱见图 4.9,第一列表示波段(300nm~1100nm),第二列表示每一个波段下对应的葡萄透射光强值。本文取
800nm~1050nm 波段的透射光谱, 经过 smoothing+MSC 预处理后, PLS 模型运算后,得到葡萄的糖浓度,如图 4.10 所示。

                                              葡萄含糖量检测仪的性能分析
5.1 基于糖分检测仪的葡萄含糖量检测结果分析

 以上两章内容已经完成了近红外波段葡萄糖分无损检测的理论研究以及便携式葡萄糖分检测仪器的设计,这章的主要内容是针对该仪器的性能进行分析验证。

  验证方案:新鲜葡萄 20 颗,分别进行标记,采用便携式葡萄糖分检测仪和手持式折糖仪分别测量葡萄的糖浓度。

  实验过程:(1)选取 20 颗新鲜葡萄,葡萄大小相近,色泽不同(青色,红色、深红色),实验前将果皮表面清理干净,并且分别进行标记。(2)采用糖量检测仪依次测量 20 颗葡萄的糖度,重复三次,记录每个样本的糖度。(3)得到所有样本的测量值(葡萄含糖量检测仪的测量值),采用折糖仪检测葡萄的实际糖度值,测量不同葡萄样本前, 应保持折糖仪棱镜表面的清洁, 葡萄汁液滴在棱镜表面后, 关上辅助棱镜,需静置 10 秒,待折糖仪读数稳定后,读取糖度值。
 20 颗葡萄的糖浓度测量结果如下表 5.1 所示:

 

 由上表可知:

 (1)该便携式仪器因为采用 USB2.0 接口通信以及基于 Win CE 系统的LJD-eWin5S 开发板,所以响应时间较短,葡萄含糖量平均检测时间为 5S。

 (2)20 颗葡萄样本的糖浓度范围为:15%~19%,糖浓度范围在葡萄含糖量检测仪预测范围之内。20 个样本中,第一次与第二次的测量结果中 65%以上的样本的相对误差在 4%范围内,60%以上的样本相对误差在 3%的范围内,第三次的测量结果70%以上的样本的相对误差都在 3%的范围内,总体而言,预测结果比较理想,基本达到了预期目的,但是,样本糖度值为 15.4%,15.2 %,18.8 %(两个),19%,18.4%的 6 个样本的预测结果较差,相对误差都在 4%以上,由此可知,葡萄糖分检测仪针对相对浓度较高和浓度较低的葡萄样本的检测结果不好,15.6%~18.2% 浓度范围内的葡萄样本的预测结果比较理想。

 (3)对 20 个样本的糖度依次进行了连续 3 次测量。任意一个样本的三次测量结果都不尽相同, 造成同一样本 3 次测量结果不相同的原因可能是因为葡萄籽粒对透射光谱有一定的干扰。但是三次测量结果中,65%样本的相对误差均在 4%的范围内,而且 3 次测量的相对误差相差不是很大,15.4%,15.2 %,18.8 %(两个),19% 的 6个样本的三次测量的相对误差都在 4%的范围之外。依据可重复性判定标准:重复性标准偏差不大于预测标准差的 0.33 倍,由表 5.1、5.2 所示,70%的样本的重复性标准偏差均小于预测标准偏差的 0.33 倍,所以该仪器具有一定的可重复性。

6.1 总结

  本课题主要研究近红外光谱技术用于水果内部品质无损检测的可行性, 课题以巨峰葡萄为研究对象,糖度为研究指标,从葡萄近红外波段的响应特征出发,利用现有的实验设备 Avantes 近红外光谱仪设备, 结合光谱预处理方法、 化学计量学分析方法,开展近红外光谱定量分析研究,建立葡萄含糖量的定量分析模型。设计开发了便携式葡萄含糖量检测仪。

  课题主要研究成果有:

 (1)学习了解了近红外光谱检测技术的原理以及特点,确定了与糖相关的特征波段;对常用预处理方法、定量分析模型以及模型的判定标准进行总结。

 (2)采用 Avantes 近红外光谱仪采集蔗糖溶液的透反射光谱,结合 PLS 和 SVR定量分析方法分析蔗糖溶液的吸光度谱与蔗糖浓度的相关性, 对比分析了 PLS 和 SVR定量分析模型的预测精度,PLS 模型预测精度更高,而且与 SVR 非线性模型相比,模型较简单,容易实现。

 (3)采集不同浓度蔗糖溶液在不同光程下(4mm,5mm,6mm 光程)的透反射光谱,研究 5 种预处理方法消除光程差异影响,其中,经过 MSC 预处理,能够消除不定光程引起的光程误差,建模结果最理想。

 (4)实验采用 Avantes 近红外光谱仪采集 50 颗巨峰葡萄的透射光程,采用 4 种方法对葡萄的原始光谱进行预处理,并且结合 PLS 法建模,其中 Smoothing+MSC 方法的预处理效果最好,结合 PLS 的建模结果为 RCV2=0.890075,RMSECV=0.03292,充分证明了近红外光谱无损检测葡萄糖分的可行性。

 (5)设计制作便携式葡萄含糖量检测仪,调试修改葡萄透射光谱的采集程序,植入 smoothing+MSC 预处理方法,PLS 定量分析算法,实现了光谱的采集、存储以及葡萄糖分的检测与显示。

 (6)分别采用糖度计、葡萄含糖量检测仪测量 20 颗葡萄的糖度值,分析对比葡萄含糖量检测仪的性能,经过分析验证,基本达到了预期的目的。

6.2 展望

  本课题基本实现了葡萄糖分的检测, 但是还存在一些有待完善和值得深入研究的地方,主要体现在以下几个方面

 (1)本课题采用的试验样本量不够多,应该扩大实验的样本量,增加实验的测量次数,将不同品种,不同产地等因素考虑在内,不断对模型进行维护,逐步优化模型。

 (2)对于糖浓度相对偏低或者偏高的葡萄的糖浓度的预测,有待解决。(3)葡萄含糖量检测仪每一次上电工作时,都要重新加载 USB 口驱动程序,给工作造成了不便,有待改进。

会员登录
登录
我的资料
留言
回到顶部