时间:2022年03月01日 分类:农业论文 次数:
摘要:发展针对异常气候条件下的作物估产模型,对于理解气候变化对作物产量的影响,提高估产模型的适用性具有重要意义。本文提出了一种综合气象灾害指标、遥感植被指数与趋势产量的随机森林回归估产方法,基于该方法构建了中国五大麦区的小麦单产估算模型,并选择典型的灾害年份在县级尺度和麦区尺度上分别进行了精度验证,对比分析了不同麦区输入变量对估产模型构建的重要性。结果显示:五大麦区估产模型拟合精度的R2均在0.95以上,各麦区县级实际单产与预测单产平均相对误差均低于0.060,区级均低于0.049;输入变量在不同麦区的重要性存在差异。标准化降水蒸散指数在五大麦区重要性均较高,干热风指标在西北春麦区与北部春麦区相比其他区域更重要,月平均温度距平与月平均降水距平在各个麦区的重要性差异不大,小麦拔节期与抽穗期的标准化差分植被指数(NDVI)重要性相对其他时间段的NDVI更高。本文构建的估产模型能够满足异常气候条件下估产的精度,可以为极端气候条件下大尺度的估产研究提供参考。
关键词:随机森林;估产;标准化降水蒸散指数;标准化差值植被指数;干热风指标;温度距平;降水距平
从20世纪上半叶至今,地球大气中的CO2浓度不断升高,变暖趋势越来越显著,全球气候变化,导致异常气候事件频发[1]。相关研究表明,尽管农业生产受气候变化的影响在不同区域有一定的差异,但整体上弊大于利[2]。我国农业受气候变化的影响十分严重[3],在各类农业气象灾害中,干旱和洪涝是影响我国农作物生产最主要的气象灾害。1980年以来,我国洪旱灾害频发。1998年的长江和松花江流域特大洪水事件和2016年的长江中下游及太湖洪涝事件直接带来上千亿元经济损失[4]。
相比洪涝,干旱对我国农业生产的影响更为严重[5]。有关统计数据表明,2007至2017年全国农作物旱灾面积年均值为1.53×107hm2,粮食损失年均值为2.14亿t,造成直接经济损失年均值为282.15亿元,占GDP均值的0.21%[6]。在全国各种气象灾害中,干旱导致的农作物受灾面积占比约56%,洪涝导致的农作物受灾面积占比约24%[7]。此外,低温冷害、干热风等气候事件的频繁发生也给我国农作物安全生产带来了巨大挑战。在中国北方麦区,干热风灾害的发生一般会导致小麦减产5%~10%,在受灾严重的年份减产率能达到20%~30%[8]。
随着遥感技术的不断发展与创新应用,许多专家学者将遥感技术应用到农作物估产中[9],为作物估产研究开辟了新途径[10]。从模型建立的理论角度 出发,当前主流的作物估产模型可以分为四类:经验统计模型、光能利用率模型、作物生长模拟模型和耦合模型[11]。探究气候变化对作物产量的影响,大多采用经验统计模型中的气象估产模型。气象估产模型发展较早,始于20世纪70年代末,基本的气象估产模型有三种。第一种,直接建立气象因子和作物产量之间的回归模型;第二种,首先计算相邻两年作物产量差和气象因子差,然后建立作物产量差和气象因子差之间的回归模型,进而进行作物产量预测。
第三种,将作物产量分解为趋势产量和气象产量两部分,前者反映由技术进步(如灌溉、施肥、新品种等)导致的产量的长期变化,后者反映由自然气候要素(光照、降水、辐射等)引起的产量的短期波动。常用的气象估产模型构建方法包括线性和非线性回归两大类[12-13]。随着数据挖掘技术的发展,神经网络、支持向量机、随机森林等新的数据挖掘手段也应用于估产模型的构建[14-16]。
Breiman[17]在2001年提出了随机森林算法。它是一种集成学习算法,具有稳定性好,预测精度高,不易产生过拟合等优点,不需要顾虑多重共线性的问题,与神经网络和线性回归方法相比,其表现更稳定,具有较强的抗干扰能力。该算法已经广泛应用于干旱监测[18]、山体滑坡预测[19]、洪涝[20]和火灾风险[21]分析等方面。但目前应用随机森林算法进行异常气候条件下的作物估产的研究甚少。
目前大多研究也并没有验证所建立的估产模型在灾害年份的估产效果。为此,本文基于随机森林算法,以气象估产模型为基础,结合气象灾害指数和遥感植被指数,在中国五大小麦种植区分别建立估产模型,并验证其在典型灾害年份的估产精度,为探究气候变化对小麦产量的影响,以及建立满足异常气候下估产精度的模型提供参考。
1研究区概况
本文研究范围包括西北春麦区、北部冬麦区、黄淮海冬麦区、长江中下游冬麦区与西南冬麦区[22-23]。西北春麦区位于黄淮上游三大高原的交汇地带,该区由宁夏全区、甘肃省大部分地区,内蒙古西北部地区构成,冬天寒冷、夏季炎热,春季与秋季多风,天气较为干燥,白天和晚上温差很大。降水不足是影响该区小麦作物生长的重要因素,部分地区春小麦生长后期有干热风危害。北部冬麦区位于我国中纬度地带,由北京全市、天津全市、河北、山西以及陕西省部分地区组成,属于暖温带季风区域。
该区冬寒春旱,降水不足且分布不均匀。黄淮海冬麦区位于黄河中下游,由山东省全部、河南省大部分区域以及陕西省与山西省南部、安徽省与江苏省北部、河北南部的少部分地区组成。该区北部小麦在低温年份有遭受低温冷害的风险,南部地区气温较高,冬小麦返青期不明显。降水量南多北少,东多西少,小麦生育期降雨可基本满足,但北部仍偶尔有旱灾发生,需灌溉。
长江中下游冬麦区由湖北全省、湖南全省、江西全省、浙江全省、上海全市,安徽省与浙江省大部分地区组成。该区大部分地区的自然条件适宜小麦生长,但该区降水极不平衡,南部降水过多不适宜小麦生长,北部降水较少时有干旱发生。西南冬麦区由重庆全市、贵州全省、四川省东部与云南省北部组成。该麦区地形复杂,包括山地、盆地、平原等多种地形,其中山地为该区主要地形,复杂的地形也导致该区域气候环境差异较大,农作物种植、成熟时间差异较大,除平原地区外,农田地块较为破碎。
2技术路线与研究方法
主要包括以下步骤:1)利用原始气象数据与遥感数据建立相应气象灾害指标与遥感植被指数;2)利用直线滑动平均法和HP滤波法拟合趋势产量,选择最佳拟合方法;3)以气象灾害指标、遥感植被指数为输入变量,实际产量为输出变量,建立样本库;4)利用随机森林算法在不同麦区建立估产模型并进行精度验证;5)筛选出各麦区不同类型灾害年份,并进行估产验证;6)对不同麦区输入变量进行重要性评价。
2.1数据获取与预处理
通过查阅资料发现在我国众多不同类型气象灾害中,对农作物生产影响较大的灾害类型主要包括旱灾、洪涝、低温冻害以及干热风四种[24-28]。为此,本文收集了气象数据与遥感数据,用于构建表示干旱、洪涝、低温冷害、干热风四种灾害的指标,以及表示小麦不同时期长势情况的遥感植被指数指标,用于估产模型的建立。具体包括:1)来自全球标准化降水蒸散指数(StandardizedPrecipitationEvapotranspirationIndex,SPEI)数据库1999—2018年的SPEIbasev2.6数据集,时间尺度为1~48月,分辨率为0.5°;2)来自欧空局哥白尼气象数据中心的1999—2018年的月平均降水量、月平均温度、14时风速、14时相对湿度、日最高温度,除了日最高温度分辨率为0.1°外,其他数据的空间分辨率均为0.25°;3)来自美国航空航天局的2000—2018年的16d合成的MOD13Q1-NDVI数据,空间分辨率为250m。
2.2输入参数计算
五大麦区范围广,小麦种植时间差异较大,各 麦区的小麦生育期间分别为黄淮海冬麦区9月-次年6月、北部冬麦区9月-次年6月、西南冬麦区8月次年7月、长江中下游冬麦区10月-次年5月、西北春麦区3月-8月,因此本文以各麦区小麦的生育期并集为研究时段来对参数进行计算。
2.2.1干旱指标本文选用SPEI8-6、SPEI6-10、SPEI6-10、SPEI5-8、SPEI7-12分别表示西北春麦区、北部冬麦区、黄淮海冬麦区、长江中下游冬麦区、西南冬麦区中小麦整个生育期内的干旱程度。其中,SPEIm-n为m月份时间尺度为n的SPEI干旱指数,用来描述m月份过去n个月整体的干旱情况。具体计算流程是首先将SPEI干旱指数重采样至1km空间尺度,用全国耕地范围数据进行耕地掩膜,然后以县域范围内SPEI干旱指数均值作为描述某县小麦生育期内整体干旱程度的指标。
2.2.2干热风指标我国小麦干热风具体可以分为高温低湿型、雨后青枯型和旱风型3种[29]。国家气象局发布了2019年干热风国家标准,采用日最高气温、14时空气相对湿度和14时风速组合,结合20cm土壤相对湿度确定了3种类型小麦干热风指标。
不同地区干热风类型不同,评定标准也不同,同时干热风灾害主要发生在我国北方麦区,具有局地性特征。为了统一各麦区干热风指标,本文采用了“三三三”标准对各麦区小麦生育期并集内干热风有效天数进行统计,也即当小麦生育期并集内某天同时满足日最高气温>30℃、14时空气相对湿度<3014>3m/s三个条件时即为一个干热风有效天。干热风有效天数指小麦生育期并集内干热风有效天的累积。
2.2.3洪涝与低温冷害指标洪涝指标的计算流程是:首先在像元尺度上计算小麦生育期内某月份平均降水的历年均值,然后用当月平均降水实际值与历年均值作差得到当月平均降水距平值,最后取县域内耕地像元距平值的均值作为描述该县当月洪涝情况的指标(下文简称为月平均降水距平)。低温冷害指标的计算方法与洪涝指标类似,计算过程不再赘述,下文简称为月平均温度距平。
2.2.4遥感植被指数计算首先对MOD13Q1-NDVI数据利用均值滤波从250m重采样至1km,然后用全国土地利用分布图对2000—2018年小麦生育期内MOD13Q1-NDVI数据进行耕地掩膜,最后用全国县级矢量对各县耕地范围内NDVI取均值,作为各县的遥感植被指数。
2.3趋势产量拟合
在气象估产模型中,通常将小麦实际产量分解为趋势产量、气象产量和随机产量三部分,其中随机产量往往忽略不计。因此,实际单产可以分解为趋势单产和气象单产之和。 本文利用直线滑动平均法(包括3a和5a直线滑动平均法)和HP滤波法[30]对五大麦区所有县小麦实际单产进行趋势产量拟合,用实际单产减去趋势单产得到气象单产。
以气象单产为输出变量,以四类气象灾害指标为输入变量,分别在五大麦区构建随机森林回归模型。模型拟合精度越高说明对气象产量拟合效果越好,也即对趋势产量拟合效果越好,以此来筛选最适合的趋势产量拟合方法。模型拟合精度用验证样本的决定系数R2,均方根误差(RMSE)和平均绝对误差(MAE)进行评价。
2.4随机森林回归与验证
随机森林算法的主要思想是从原始训练集中有放回地抽取k个样本,且每个样本的样本容量均与原始训练集的大小一致;然后对每个样本分别进行回归树建模,得到k个建模结果,最后以每一棵回归树预测结果的平均值作为最终预测结果[31]。
随机森林估产模型的输入变量包括趋势单产1个、干热风有效天数1个、SPEI干旱指数1个、生育期内月平均降水距平N个、生育期内月平均温度距平N个、生育期内每16d的NDVI植被指数M个,合计2N+M+3个。需要注意的是,不同麦区小麦的生育期不同,因此生育期内月平均温度距平和月平均降水距平的个数N在不同麦区将发生改变。以样本集中3/4样本子集作为训练样本建立回归模型,1/4样本子集作为验证样本进行估产模型拟合精度的验证。随机森林回归模型拟合精度用模型决定系数R2、验证样本的均方根误差、平均绝对误差以及平均相对误差进行评价。
2.5灾害年份估产精度验证
采用麦区内主要省(直辖市)农作物受灾面积累计的大小来表示各麦区整体受干旱、洪涝、低温冷害三类气象灾害导致的农作物受灾情况。
另外,由于年鉴统计数据中不包含干热风灾害统计数据,因此对于不同麦区干热风灾害年份的确定,主要参考了其他专家学者的相关研究。灾害年份确定之后,将五大麦区灾害年份对应的样本进行剔除,对各麦区重新建立随机森林回归模型,然后将各麦区旱灾、洪涝灾害、低温冷害、干热风灾害年份对应的样本的自变量代入重新训练好的模型进行灾害年份产量预测。
最后在县级尺度和麦区尺度分别进行了精度验证。县级尺度验证用各麦区中所有县小麦单产真实值和预测值的相对误差的平均值表示。麦区尺度验证用各麦区实际单产和预测单产的相对误差进行评价。其中,各麦区实际单产是先用各县实际单产与各县实际种植面积计算得到麦区实际总产量,再用实际总产量除以总种植面积得到。同理,各麦区预测单产是先用各县预测单产与各县实际种植面积计算得到麦区总预测产量,再用麦区总预测产量除以总种植面积得到。
2.6特征重要性评价方法
用随机森林中某个树节点的样本方差与分裂后两个叶子节点样本方差进行差值运算,用该差值来评价某个特征的重要性程度,差值降低越高表示该特征重要性越大。计算得到模型所有特征重要性后,对所有特征重要性值作归一化处理[32]。主要说明的是:对于某一模型,所有特征重要性值累积为1,特征重要性具体的值本身并无意义,因此分析时关注的是特征重要性值之间的相对差异。
3研究结果
以2000—2019年《中国农村统计年鉴》全国各省农作物自然气候灾害损失数据为基础,以各麦区主要省(直辖市)农作物受灾面积累计的大小为依据,对五大麦区不同类型灾害的典型年份进行确定。例如,西北春麦区主要包括甘肃、宁夏以及内蒙古西北部地区,内蒙古西北部地区多为戈壁沙漠地带,故用宁夏与甘肃农作物受灾面积的累计来表示该区整体农作物受灾状况;西南冬麦区主要包括重庆与贵州全部、四川中东部、云南中北部以 及陕西南部少部分地区,故用重庆与贵州农作物受灾面积累计并参考四川、云南农作物受灾面积来表示该区整体农作物受灾状况,其他三个麦区进行类似分析来确定不同类型灾害的典型年份。
低温冷害、干旱和洪涝灾害严重年份在西北春麦区分别为2004年、2000年和2013年,在北部冬麦区分别为2006年、2001年和2007年,在黄淮海冬麦区分别为2005年、2001年和2003年,在长江中下游冬麦区分别为2008年、2001年和2003年,在西南冬麦区分别为2008年、2001年和2002年。
干热风灾害有较强的区域性,其主要集中在我国河西地区、黄淮海平原等地区[33],即西北春麦区、北方冬麦区以及黄淮海冬麦区。已有研究表明[26,29,34-35],1960年至2017年河西地区干热风发生总次数和日数先缓慢减少后迅速增多,其中2004年的干热风发生总天数最高,持续天数也达到了历年最长(12d);1961年至2015年黄淮海平原地区干热风日数总体呈下降趋势,但是在2001年黄淮海平原地区仍发生了一次严重的干热风灾害,区域平均干热风日数达8.1d。因此,本文将 2004年作为西北春麦区干热风灾害年份,2001年作为北部冬麦区与黄淮海冬麦区的干热风灾害年份。长江中下游冬麦区与西南冬麦区未进行干热风灾害年份的确定。
4讨论
4.1本研究的主要科学贡献
1)传统的气象估产模型的输入变量往往是原始的气象要素,如降水量、温度等,而非气候指标。气候指标是一定气候条件下的单项气候要素或多种气候要素综合的特征量,如干旱指数,热浪指数,高温指数等。气候指标能更加综合的反映气候条件的变化,特别是考虑作物生长条件的农业气候指标,能更好的衡量农业气象条件的利弊。本文从影响小麦生长的主要农业自然灾害(干旱、洪涝、干热风和低温冻害)出发,计算了SPEI干旱指数、降水距平、干热风指数和温度距平来反映研究区中四个主要农业自然灾害的情况,据此构建的估产模型经过验证可以有效的进行灾害年份小麦的产量估计。
2)NDVI指数(包括NDVI的最大值、生长季的NDVI累计值等)是遥感估产中最常用的植被指数。传统的遥感统计估产模型往往只依托于遥感指数,而不考虑非遥感数据。本研究综合使用遥感数据和气象数据进行估产模型的建立。相比单纯的遥感数据,加入气候数据能够增加模型估产结果的稳定性,减少由传感器衰变,大气条件差异等造成的植被指数本身年际间的变化而产生的估产误差。相比单纯使用气候指数,遥感数据能够在一定程度上反映人类活动的影响,例如人工灌溉对干旱的抵御作用,从而避免仅仅考虑气候灾害指数而带来的产量低估。
3)本文利用随机森林算法对各个麦区估产模型的输入变量的重要性进行了分析,可以帮助我们更好的理解影响各个麦区小麦产量的主要因素,为不同区域的小麦防灾减灾措施的制定提供参考,也可以为其他区域的小麦估产研究和其他作物估产模型的建立提供输入变量筛选的方法借鉴。
4.2本研究的不足之处
1)计算2000—2018年小麦种植区各县四类灾害指标与遥感植被指数时,考虑到工作量和试验可行性,以及每年对全国小麦空间分布提取也同样存在一定的误差,最终选择用2010年全国土地利用空间分类图中耕地范围来代替各县小麦种植区进行参数的计算,这会在一定程度上带来误差。例如对于NDVI变量,长江中下游冬麦区的5月25日至6月9日的NDVI重要性显示很高,其次是4月7日至4月22日的NDVI,前者小麦已经进入收获期,后者在抽穗期,这一结果和理论预期不符合。
究其原因可能是长江中下游的小麦种植面积总体小于水稻的种植面积,小麦收获期时以耕地范围统计出来的NDVI指数很大程度上是水稻的信息,5月25日至6月9日大致在早稻的拔节孕穗期和中稻的移栽期,此时发生干旱对水稻的产量影响很大。
2)本文根据各省(直辖市)农作物自然灾害损失数据进行各麦区灾害年份的确定,一方面灾损数据并不只针对小麦,另一方面灾损数据是按照行政单元统计的,而麦区是跨行政单元的。我们以麦区包括的主要省(直辖市)的灾损总量来反映整个麦区的灾损情况,由此确定各麦区不同灾害类型的典型灾害年份,可能会产生一定误差。在后续的研究中可以考虑根据时间序列气象数据进行不同类型灾害年份的确定。
3)本文选择的SPEI干旱指数和干热风有效天数是对小麦生育期整体灾害情况的描述,然而发生在不同生育期的相同灾害对作物产量的影响是不同的,在后续的研究中需要在小麦不同生育期对灾害指标进行计算,以便分析在小麦不同生长阶段发生的气象灾害对产量的影响差异。
气象工程论文: 气象因子对赤霞珠果实GLVs香气的影响
5结论
本文基于随机森林算法,以气象灾害指标、遥感植被指数、趋势产量为输入变量,构建了五大麦区的估产模型,并在典型灾害年份进行了估产精度的验证,得到如下主要结论:
1)精度验证结果显示,各麦区回归模型的决定系数R2均达到了0.95以上,验证样本的平均相对误差均低于0.073,均方根误差均低于200.835kg/hm2,平均绝对误差均低于131.655kg/hm2。各麦区所有县灾害年份实际单产与预测单产平均相对误差均低于0.060,各麦区区级实际单产与预测单产的相对误差均低于0.049。
2)输入特征的重要性在不同麦区具有一定的差异性,与地区气候差异情况有关。SPEI干旱指数在五大麦区重要性均较高,表明干旱仍然是五大麦区影响小麦生产的重要因素;干热风指标重要性在西北春麦区与北部春麦区较高,符合干热风主要发生在河西与黄淮海地区的局地性特点;各麦区月平均温度距平重要性与月平均降水距平重要性整体差异比较小;总体来说拔节期与抽穗期的小麦NDVI相比其他时间段的NDVI更重要。
参考文献:
[1]Masson-DelmotteV,ZhaiP,PiraniA,etal.ClimateChange2021:ThePhysicalScienceBasis,theWorkingGroupIContributiontotheSixthAssessmentReportoftheIntergovernmentalPanelonClimateChange[M].CambridgeUniversityPress:CambridgeandNewYork,2021.
[2]姜彤,李修仓,巢清尘,等.《气候变化2014:影响、适应和脆弱性》的主要结论和新认知[J].气候变化研究进展,2014,10(3):157-166.JiangT,LiXC,ChaoQC,etal.Highlightsandunderstandingofclimatechange2014:Impacts,adaptation,andvulnerability[J].ProgressusInquisitionesDEMutationeClimatis,2014,10(3):157-166.
[3]权畅,景元书,谭凯炎.气候变化对三大粮食作物产量影响研究进展[J].中国农学通报,2013,29(32):361-367.QuanC,JingYS,TanKY.Progressinresearchofimpactsofclimatechangeonyieldofthreemajorgraincrops[J].ChineseAgriculturalScienceBulletin,2013,29(32):361-367.
[4]贺大兴.极端气候对中国粮食产量影响的定量分析[J].中国农业资源与区划,2017,38(4):28-34.HeDX.QuantitativeanalysisontheeffectsofextremeclimateongainproductioninChina[J].ChineseJournalofAgriculturalResourcesandRegionalPlanning,2017,38(4):28-34.
作者:朱秀芳1,2,4,李石波3,石振君3,任笑3,程昌秀4