奥谱天成(厦门)科技有限公司
Optosky Technology Co., Ltd.
服务热线:
0592-6102588

基于可见近红外光谱的糖类别快速鉴别研究

发表时间:2016-06-06 14:44作者:林萍,陈永明,何 勇来源:万方数据网址:http://www.wanfangdata.com.cn/

 现在市场上供应糖的品种越来越多,功能也各异,消费者应该根据自身的需要选择适合自己的糖。市场上的糖大致有四种:白砂糖、木糖醇、双歧糖和葡萄糖。

 白砂糖即白糖,蔗糖含量一般在95%以上,是饮料、食品和制药工业不可少的重要原料。适当食用白糖有助于提高机体对钙的吸收,但过多就会妨碍钙的吸收。糖尿病病人不宜直接食用食糖,最好是以甜味剂替代。

 葡萄糖是生物体内新陈代谢不可缺少的营养物质,它的氧化反应放出的热量是人类生命活动所需能量的重要来源。在消化道中,葡萄糖比任何其他单糖都容易被吸收,而且被吸收后能直接为人体组织利用。木糖醇为白色晶体,外表和蔗糖相似,是多元醇中最甜的甜味剂,甜度相当于蔗糖,热量相当于葡萄糖。木糖醇仅仅能被缓慢吸收或部分被利用,热量低是它的一大特点。

 木糖醇是人体糖类代谢的中间体,无需胰岛素促进,木糖醇也能透过细胞膜,被组织吸收利用,供细胞以营养和能量,且不会引起血糖值升高,是适合糖尿病患者食用的营养性的食糖代替品。

 双歧糖是以异麦芽低聚糖和果糖低聚糖为基料研制生产的一种甜度相当于蔗糖3~4倍,热量只有蔗糖1/6的新型糖。因其甜度高、热量低,不易为肠胃吸收,所以没有蔗糖容易引起肥胖和龋齿的负作用,是喜欢甜食又关心健康者、以及忌食蔗糖者的理想糖源。由于其热量低,对血糖影响很小,基本不依赖胰岛素,糖尿病人使用更安全。
 本文提出了一种快速简便无损鉴别糖类的可见一近红外光谱法。国内外很多学者利用近红外光谱技术进行物质品种鉴别,如苹果品种、中药材、酸奶品种、奶粉品种[、杨梅品种、脸谱识别等。但在糖的品种鉴别方面,还鲜有报道

 偏最小二乘法是一种目前应用较广泛的光谱分析的数学方法。可以实现全谱或部分谱数据的分析;数据矩阵分解和回归交互结合为一步,得到的特征值向量直接与被测组分或性质相关;对于样本数量少,变量多的情况下更具有优越性。人工神经网络是模仿人脑神经细胞的结构和功能的系统。目前应用较广的是一种基于误差反向传播算法的BP神经网络。由于具有高度非线性映射的能力,现已在各领域得到了广泛的应用,取得了令人满意的结果。本文用基于偏最小二乘法与BP神经网络相结合的识别方法,研究用近红外光谱技术对糖进行种类鉴别,并对40个未知样本进行预测,准确率为i00%,40个样本的预测相对偏差均在5%以下,说明本文提出的方法对于糖具有很好的分类和鉴别能力。

1材料与方法
1.1仪器设备
 美国ASD(analytical spectral device)公司的HandheldFieldSpec光谱仪,光谱采样问隔为1.5 nlTI,测定范围在325~1 075 nlTl之间,扫描次数30次,探头视场角为20。。光源采用与光谱仪配套的14.5 V卤素灯。得到的光谱数据经
View Spec Pro软件转化为ASCLL码形式,再由分析软件Unscrambler V9.7和DPS对数据进行分析处理。

1.2样品来源及光谱的获取

 从超市买来太古纯正白砂糖、禾甘木糖醇、双歧糖(无糖型)、红芍口服葡萄糖。各取4包样本,每包400 g。各种糖样本均用直径为120 mm,高度i0 Inln的培养皿装满作为一个实验样本。每个种类各做40个样本,共计160个样本。全部实验样本随机分成建模集和预测集,建模集有120个样本(每个种类30个),预测集有40个样本(每个种类lo个)。光谱仪经白板校准后进行测试。光谱仪置于样本的上方,距糖表面120 n2ffn,对每一个样本扫描30次。

1.3光谱数据预处理
 为了去除来自高频随机噪声、基线漂移、样本不均匀、光散射等影响,需要进行光谱预处理来消除噪声。先对数据进行Savitzky Golay Derivatives处理,再采用Savitzky-Golay平滑法,选用平滑点数为9,此时能很好滤除各种因素产生的高频噪音。最后对数据进行SNV处理。由于光谱曲线在首端和末端有较大噪音,如图1所示,所以只取400 1000nm波段的光谱用于分析。


1.4 最小二乘法(PLS)
 偏二最小乘法是一种很有效的多元统计方法,能够建立光谱数据和成分之间的相互关系,适合于光谱分析中的线性模型,是一种广泛使用的近红外光谱数据处理方法。但当因变量和自变量不完全呈线性关系时,采用线性处理可能会使分析结果带来一定的偏差,因此需要在PLS模型的基础上引入非线性的部分,人工神经网络是目前常用的非线性模型。

1.5 BP神经网络模型
 本研究建立了一个3层BP神经网络。所有的样本随机地分成学习集和预测集数据,其中120个样本为学习集样本,40个样本为预测集样本。网络输入层、隐含层、输出层节点数分别为n,8,1,其中输入层的11个节点来自P15分析得到的主成分。最小训练速率为0.1,设定训练迭代次数为2 000次,对输入样本进行标准化处理。

2试验结果与分析
2.1不同种类糖的近红外光谱图分析

 四种糖的典型近红外光谱如图1所示。从图中可以看出,不同种类糖的光谱曲线有明显区别,并具有一定的特征性和指纹性,这一差异为糖的不同种类鉴别奠定了数学基础。选择波长范围在400 1000m的光谱,应用ASDViewSpec Pro软件,把糖的光谱曲线做平均处理,并转换成ASCII码,形成反射率矩阵,用偏最小二乘法对其聚类。

2.2不同品牌糖的聚类分析
 对白砂糖、木糖醇、双歧糖和葡萄糖各30个,共120个样本进行主成分分析。前3个主成分的特征值及累计可信度如表1所示。由于前2个主成分的可信度已达97.7%,故仅用前2个主成分就可表示近红外光谱的主要信息。

图2表示120个建模样本的主成分1和2得分图,横坐标表示每个样本的第一主成分得分值,纵坐标表示每个样本的第二主成分得分值。从图中可以看出,白砂糖(Saccharose)、木糖醇(Xylit01)、双歧糖(Bifid sugar)、葡萄糖(Glu—cose)四种糖明显分成4类,葡萄糖的30个样本聚合在第一象限,双歧糖的30个样本聚合在第二象限,白砂糖的30个样本聚合在第二象限,木糖醇的30个样本聚合在第四象限,这四种糖中除了白砂糖有个别样本稍微有所偏离,其余三种糖的聚类性都很好。说明主成分1和2对四种糖有较好的聚类作用。

2.3模型参数的确定和PLS成分的提取

 采用PIS分析方法,经交互验证法判断,最佳主成分数为11,主要的模型参数见表2。选用11个主成分模型其残差(Rv)o.000 985,相关系数(r)0.999 916,同时,它的校正集标准偏差(sEC)为0.014 538。由于是对糖的种类进行鉴别,用l,2,3,4分别代表四种不同品种的糖,并将其作为y变量。从原有变量中提取新变量,即对原有变量进行线性组合构成新变量。提取的新变量保留了尽可能多的原有变量的有用信息,并且变量数尽可能地少,变量之间相互独立,这就是特征变量。PLS成分是从原有自变量的样本数据矩阵X中提取的相互正交的成分,他们既保留尽量多与因变量的相关性,又保留了较多的方差,从而在消除原有自变量共线性的同时,使建立的回归模型仍能充分地反映出自变量与因变量之间的相互关系。从表2中可看出,y变量与PCIl的相关性最大。


 

2.4基于特征变量建立liP神经网络模型
 光谱波段是400~1 000 am,如果全部将其作为神经网络的输入,大大加大了神经网络的计算量,影响学习速率。而且有些区域样品的光谱信息很弱,与样品的组成或性质问缺乏一定的相关性。而主成分分析得出的前面11个主成分已经包含了大部分光谱信息。因此,将这11个特征变量作为BP神经网络的输入变量,即网络输入层、隐含层、输出层节点数分别为1l,8,1。训练集和预测集样本数为i20和40.对40个未知样本的预测结果见表3,预测样本1至10号真实值为1,预测样本11至20号真实值为2,预测样本21至30号真实值为3,预测样本31至40号真实值为4,依次代表白砂糖、木糖醇、双歧糖、葡萄糖这4个种类。拟合残差为0.000 023,40个样本的预测相对偏差均在5%以下,即预测的正确率达到了100%。

3 结论

 应用近红外光谱技术建立了糖类别鉴别的模型,该模型的预测效果很好,对未知样品的预测相对误差均在5%以下.识别率达到100%。说明运用近红外光谱可以快速、准确对糖类别进行鉴别。采用偏最小二乘法和BP神经网络相结合的方法,大大提高了识别的精确度。将从PLS分析中得到的特征变量作为BP神经网络的输入,不但减少了神经网络的计算量,加快了训练速率,而且因为去除了光谱干扰信息,也提高了预测的正确率。因此,用偏最小二乘法结合BP神经网络的模式识别和近红外光谱技术研究糖类别鉴别是可行的。


会员登录
登录
我的资料
留言
回到顶部