奥谱天成(厦门)科技有限公司
Optosky Technology Co., Ltd.
服务热线:
0592-6102588

估测田间烟叶色素含量的光谱模型研究

发表时间:2016-06-12 14:43作者:任晓,劳彩莲来源:万方数据网址:http://www.wanfangdata.com.cn/

  植物的叶绿素含量与植物的光合能力及生长发育状况密切相关,可作为评判植物营养生理状态的一个重要指标 。类胡萝卜素则具有保护叶绿素的功能 ,其可以参与叶黄素的循环过程 ,消耗叶片吸收的过剩光能 ,从而避免光合系统受到伤害。另外 ,类胡萝卜素在高等植物叶绿体中还发挥着重要的结构作用 ,可以保护类囊体膜免受过氧化反应的损伤 ,从而增强维生素 E 所提供的光保护。烟草叶片的色素含量是影响烟叶品质的重要成分 ,烟叶的叶绿素含量与评吸得分呈负相关 ,而类胡萝卜素含量则与各项评吸得分呈显著正相关。因此 ,明确烟草叶片的色素含量变化规律对于提高烟草产质量具有重要意义。传统的烟叶色素检测主要采用化学方法 ,需要采摘叶片 ,费时费力且破坏烟草生长 ,无法满足高效生产管理的需要 。快速无损测定烟叶色素含量的方法则具有明显的优势 。光谱分析技术因其无损 、快速 、高效等优势 ,近年来已被广泛应用于建立植物色素含量的光谱估测模型 。
 由于植物叶片反射光谱在可见光范围主要受色素含量的影响 ,因此可用叶片的反射光谱来估测色素含量 。国内外学者通过对枫树、甜栗子等植物的研究 ,发现对叶绿素和类胡萝卜素最敏感的波段是 550 nm 附近 、700 nm 附近以及750 nm 以上的近红外波段 ,并提出了多种与植物叶片色素含量相关的光谱指数。近年来随着数据分析处理技术的发展成熟 ,通过 PLS、神经网络、支持向量机等方法建立的叶片色素含量估测模型也在苹果 、水稻等植物上得到广泛应用 。支持向量机(support vector machine ,SVM )是 Vap‐nik 和 Cortes提出的基于 VC 维理论和结构风险最小化原理的一种新的机器学习方法 ,它在小样本 、非线性等方面具备传统学习方法所没有的优越性 ,比神经网络方法有更加严格的数学理论基础 ,因此采用 SVM 方法建立光谱分析模型具备明显的优势和应用前景 。

  目前这类新型建模方法的研究多集中在小麦 、玉米 、水稻等以花和果实为最终收获对象的窄小叶型作物上 。烟草是以叶片为产品的阔叶型作物 ,目前对于烟草叶片色素含量的估测模型研究较少 ,主要研究方法仍然集中在光谱指数的筛选和线性回归方法从烟草营养生长期到成熟期 ,烟叶结构和生化组分都发生了较大改变 。因此本研究结合烟草的生长发育特点 ,选择在烟草的营养生长期和成熟期采集样品 ,建立了基于光谱指数和支持向量机的两种光谱分析模型 。通过比较这两个生育
期建立的模型的预测效果 ,选择出稳定性和适应性最佳的建模方法 ,以期为田间烟叶的质量控制和品质判别提供科学依据 。
1 实验部分
  田间实验在云南省玉溪烟草科技示范园赵桅基地 (24°18′N ,102°29′E ,海拔 1642 m)进行 。土壤类型为水稻土 ,种植的烟草品种为 K326 。依据烤烟高产优质栽培技术方案推荐的施氮量(7 g ・ 株 - 1 ) ,设计了 6 个施氮水平处理 ,分别为7g ・ 株 - 1 、 推荐施氮量的 60% , 80% , 100% , 120% 和140% 。
1.1 光谱采集
  利用美国 ASD 公司的 FieldSpec3 便携式分光辐射光谱仪 ,在田间原位采集烟叶反射光谱 。 光谱仪的波长范围为350 ~ 2 500 nm ,其中 350 ~ 1 050 nm 的波长采样间隔为 1. 4nm ,1 050 ~ 2 500 nm 之间的波长采样间隔为 2 nm 。采用高强度接触式探头配置叶片夹 ,在烟叶主脉两侧沿叶尖 、叶中 、叶基顺序各采集两条光谱 ,得到烟叶的平均光谱 。根据烟叶生长发育阶段 ,实验于 6 月 5 日 ,6 月 14 日 ,6 月 27日 ,7 月 5 日 ,7 月 13 日 ,7 月 24 日 ,8 月 7 日和 8 月 21 日采集了共 213 个烟叶样品 ,其中营养生长期样品 126 个 ,成熟期样品 87 个 。
1.2 色素含量测定
  根据分光光度法测定色素含量 。将鲜样放入研钵 ,加少量石英砂和碳酸钙粉及 3 mL 95% 乙醇 ,研磨成匀浆 ,再加乙醇 10 mL ,继续研磨至组织变白 。静置 5 min 后将提取液过滤到 25 mL 棕色容量瓶中 ,用 95% 乙醇定容至刻度 。把叶绿体色素提取液倒入比色杯内比色测定色素 ,以 95% 乙醇空白 ,在波长 470 ,649 和 665 nm 下测定吸光度 ,并根据以下公式计算出叶绿素和类胡萝卜素含量

 其中 ,ca 和 cb 分别为叶绿素 a 、叶绿素 b 的浓度 ,单位是 mg・ L-1;cxc为类胡萝卜素的总浓度 ,单位是 mg ・ L-1

1.3 建模方法
  采用支持向量机建立色素含量光谱估测模型 。首先通过用内积函数定义的非线性变换将输入空间(即光谱数据)映射到高维空间 ,在这个空间进行回归分析 ,建立光谱数据与色素含量的估测模型 。设定烟叶样品集 D = {(xi ,yi ) ,i = 1 ,… ,n} ,其中 xi ∈ Rn ,yi ∈ R 为第 i 个样品数据 ,则 SVM 回归函数为

SVM 中可选择不同的内积核函数实现非线性函数拟合 ,本文选择 RBF 高斯径向基核函数建立色素含量的 SVM 回归模型 ,其中 σ为核宽度 ,设定g =1/(2σ 2) 。

 SVM 模型的关键在于选择惩罚参数 c 和核参数g。参数c控制对超出误差样品的惩罚程度 ,平衡模型的经验风险和结构风险 ,取其折中以提高模型的泛化性能。g 控制模型的回归误差 ,g 过小则方差较低 ,g 过大则容易造成过拟合 。基于上述原则 ,使用基于网格搜索的5折交叉验证法来选择惩罚参数 c 以及核参数 g 。网格搜索是在 c 和 g 组成的参数空间内 ,遍历网格空间中每个点的参数组合 ,针对每个参数组合通过交叉验证的方法分别计算其估计模型的 MSE ,MSE最小的组合即为最优参数。选取传统光谱指数 GM2作为特征变量 ,建立线性回归模型估测烟叶色素含量 。

其中 ,R750和 R700分别表示波长在 750 和 700 nm 处的光谱反射率 。
  将营养生长期采集的 126 个烟叶样品 ,按照 2 ∶ 1 的比例随机划分为建模集 (84 个 )和验证集 (42 个 )两部分 。 用SVM 和光谱指数 GM2 两种方法建立烟叶的田间反射光谱与叶绿素 、胡萝卜素含量之间的关系模型 ,并在验证集上比较两种模型的预测能力 。同样 ,将成熟期所采集的 87 个烟叶样品随机划分为建模集 (58 个 )和验证集 (29 个 )两部分 ,建立 SVM 和光谱指数 GM2 色素含量估测模型 。最后 ,再分别混合两个时期的建模集样品(142 个)和验证集样品(71 个 ) ,建立 SVM 和光谱指数 GM2 色素含量估测模型 。最终根据模型的预测效果选择田间烟叶色素含量的最优估测模型 。

2 结果与讨论
2.1 烟叶色素含量分析

  表 1 给出了不同时期采集的烟叶样品的色素含量范围 。由表 1 可见 ,营养生长期和成熟期烟叶中叶绿素含量均高于类胡萝卜素含量 ,营养生长期烟叶色素含量均值高于成熟期 ,这是由于营养生长期烟草植株光合能力不断增强 ,因此叶绿素等色素含量也不断增加 ,进入成熟期以后烟叶的色素
含量则逐渐降低 。
2.2 田间烟叶光谱分析
  图 1 为营养生长期和成熟期采集的田间烟叶反射光谱 ,其中图 1(a)和图 1(c)为可见‐近红外波段反射光谱 ,图 1(b)和图 1(d)为可见光波段反射光谱的放大显示 。由图可知 ,营养生长期和成熟期烟叶的反射光谱波形特点和趋势基本一致 。其中 400 ~ 490 nm 波段平均光谱反射率较低 ,这是由于叶绿素 a 和叶绿素 b 的吸收峰分别为 431 和 456 nm ,类胡萝卜素则在 450 nm 左右有两个相邻的吸收峰 ;490 ~ 600 nm波段由于叶绿素在 550 nm 处的强反射特性出现了第一个反射峰 ;600 ~ 700 nm 波段又因为叶绿素在 675 nm 处的强吸收特型出现了较明显的波谷 ;700 ~ 750 nm 波段位于植被反射率红边 ,烟叶的平均反射光谱急剧上升 ,在 750 nm 左右达到反射率峰值 ;750 ~ 1350 nm 近红外波段的高反射率反映了烟草叶片在此波段的弱吸收特征 ;1 350 ~ 2 500 nm 波段反映了生化组分以及水分的信息 。水分在 1 450 ,1 940 和2700 nm 附近的强吸收特性导致了位于 1 650 和 2 200 nm附近的两个反射峰。

 两个生育期的烟叶反射光谱在可见光谱在可见光区域有细微差异,主要表现在 550 ~ 700 nm 波段 [图 1(b)和图 1 (d)] ,其中营养生长期所采集样品在这一区域的光谱反射率较低 ,约为0.1 ~ 0.3 ;成熟期所采集样品则光谱反射率较高 ,约为 0. 2~ 0. 4 。

2.3 特征光谱提取
  将采集的所有烟叶样品的反射光谱转化为吸光度光谱 ,并与色素含量进行归一化处理后进行相关性分析 ,选择相关性曲线上较为明显的几处波峰作为特征波长 (表 2) 。可以看出 ,与叶绿素和类胡萝卜素含量相关性高的区域都集中在了可见‐近红外区域 ,其中 550 nm 正是绿光的中心波长 ,719nm 则属于红边位置 ,这也说明了植物叶片的吸光度光谱在可见‐近红外区域主要受色素含量的影响。

2.4 光谱色素含量估测模型
  考虑到营养生长期和成熟期烟叶色素含量变化以及样品数量差异 ,首先利用营养生长期和成熟期的建模集样品 ,结合烟叶反射吸光度光谱与色素含量相关的特征波长 ,分期建立 SVM 模型和 GM2 光谱指数模型 ,并分别在验证集上进行验证 ;再将营养生长期和成熟期的建模集样品混合建模 ,以此比较分期建模和混合建模对烟叶色素含量估测性能的差异 ,同时比较 SVM 方法和光谱指数法构建模型的效果 。表 3 列出了叶绿素和类胡萝卜素含量的 SVM 模型参数 。表 4 给出了 SVM 模型和 GM2 光谱指数模型在验证集上的预测结果 ,可以看出 ,分期建模和混合建模对色素含量的估测效果差异并不显著 ,两种方式建模均可有效估测色素含量 。对叶绿素含量的估测用 SVM 方法和 GM2 光谱指数法均达到较高的估测精度 ,这可能是因为叶绿素含量的特征波长比较突出 ,与叶片反射光谱的相关性也比较高 。其中 SVM混合建模效果最好 ,估测决定系数和均方根误差分别为0.898 6 和 0.0123。

  对类胡萝卜素含量的估测 SVM 方法优于 GM2 光谱指数法 ,这可能是因为烟叶中类胡萝卜素含量较低 ,光谱指数GM2 只利用了两个特征波长点的光谱信息 ,而 SVM 模型因其在细节特征提取方面具备优势 ,因此其对烟叶类胡萝卜素含量具有更好的估测效果 。类胡萝卜素含量的 SVM 模型在分期建模和混合建模中得到了同样的均方根误差0.0025且决定系数都超过了 0.83 。而光谱指数 GM2 对类胡萝卜素含量的估测决定系数在分期建模和混合建模中均低于 0.75 ,均方根误差也更高 。
  总体上看 ,烟叶中叶绿素含量的光谱估测模型预测精度要高于类胡萝卜素含量的光谱估测模型预测精度 ,这是由于叶片中的类胡萝卜素含量远低于叶绿素含量且叶片对可见‐近红外波段的感知主要依靠叶绿素 ,因此叶绿素含量的估测模型精度要略高一些 。
  图 2 — 图 5 分别为 SVM 模型和光谱指数 GM2 模型对色素含量分期建模和混合建模的估测效果 ,可以看出分期建模和混合建模对色素含量的估测点与实测点都较为集中地分布在 1 ∶ 1 线附近 ,能够直观地反映出叶绿素和类胡萝卜素含量的变化情况 。建模结果说明 SVM 模型对色素含量的估测效果较好 ,对建模集模型的泛化性能也表现得较为出色 。

3 结论

  通过测定营养生长期和成熟期烟叶样品,研究了光谱指数 GM2 和支持向量机两种方法估测烟叶叶绿素及类胡萝卜素含量的效果 。两种方法都取得了较好的估测效果 ,但 SVM 方法估测精度更高 ,这证明了前人关于光谱指数估测烟草叶片色素含量的可行性,也说明用 SVM 方法估测农作物叶片理化参数具有更高的预测精度。目前 SVM 方法在烟草上的应用较少 ,利用相关性分析和归一化预处理将提取的特征光谱作为支持向量机模型的输入 ,建立了烟草营养生长期和成熟期以及混合两个时期的烟叶样品光谱色素含量估测模型 。结果表明:

 (1)营养生长期烟叶色素含量高于成熟期烟叶色素含量这与植株的光合作用有关 。
 (2)分期建模和混合建模对模型的估测效果差异不显著 ,两种建模方式均可有效估测色素含量 。 对于叶绿素含量 ,SVM 方法和 GM2 光谱指数法都得到较高的估测精度 。对于类胡萝卜素含量 ,SVM 方法比 GM2 光谱指数法估测精度更高 。
 (3)SVM 方法比传统光谱指数建模方法具有更高的估测精度以及更稳定的估测性能 。研究表明 SVM 方法可以更有效地估测烟草叶片的色素含量 ,其在验证集上对叶绿素含量分期建模以及混合建模得到估测决定系数分别为 0.8629 和0.8985,均方根误差分别为0.0155 和0.0123。对类胡萝卜素含量的估测决定系数分别为0.8370和0.8527,均方根误差均为 0.0024。在今后的实验中增加用于建模和验证的样品数并降低样品测量误差 ,将有助于提高模型的估测精度和稳定程度 。本研究结果可为田间烟叶色素含量的快速无损测定以及烟叶品质评判提供科学依据 。



会员登录
登录
我的资料
留言
回到顶部