-
生物通官微
陪你抓住生命科技
跳动的脉搏
数学科学学院陈松蹊团队提出基于污染过程的空气质量评估方法
【字体: 大 中 小 】 时间:2022年11月05日 来源:北京大学新闻网
编辑推荐:
北京大学数学科学学院、统计科学中心陈松蹊教授团队利用大数据统计算法筛选污染过程和建模分析,在先前“静稳期数据实验”有效度量本地排放的成果基础上,提出了基于污染过程的空气质量评估方法。近日,该研究的论文“Episode Based Air Quality Assessment”在大气环境领域重要国际期刊Atmospheric Environment上发表。
空气污染是一个重要的环境和公共卫生问题,尤其在发展中国家。衡量污染排放水平及其对空气质量的影响受到气象条件、污染物区域传输等多因素的综合影响,是空气质量管理中一项紧迫而极具挑战性的任务。北京大学数学科学学院、统计科学中心陈松蹊教授团队利用大数据统计算法筛选污染过程和建模分析,在先前“静稳期数据实验”有效度量本地排放的成果基础上,提出了基于污染过程的空气质量评估方法。近日,该研究的论文“Episode Based Air Quality Assessment”在大气环境领域重要国际期刊Atmospheric Environment上发表。
文章以位于华北平原北部的北京、唐山和保定三个城市为研究对象,根据地理位置分成四个组群:北京东南、北京西北、唐山、保定。针对2013年3月至2020年2月七个季节年的空气质量数据和气象数据,首先通过数据驱动算法选择污染事件,采用线性回归和随机森林方法,研究六大空气污染物(PM2.5,NO2,CO,SO2,O2和PM10)在污染过程的平均/总污染负荷,它和污染过程前、污染过程期间的气象条件变量紧密相关。同传统的全样本方法相比,该方法对空气质量的界定和分析更清晰,以不同的视角评估空气质量。
“污染过程”数据选择是本研究的一个重要前提和关键,基于华北平原的地理特点和气象现实,“污染过程”从强大的偏北风系统彻底地使空气清新后的低PM2.5水平开始,继而是局部排放积累形成的静稳期,紧接着区域运输和空气停滞带来高污染甚至严重污染水平,最后北风的清洁过程使PM2.5浓度再度降至低值。具体由三个关键时间点确定:(i)污染过程开始时间ts,(ii)持续的污染积累下达到峰值时间tp,(iii)污染过程的结束时间te。基于不同城市的污染和气象水平差异,定义了强清洗和弱清洗两种情况。
图1 强清洗(左)和弱清洗(右)两类污染过程PM2.5时间序列数据,分别选自2018年秋季北京东四监测点和2014年冬季保定华电二区监测点
为了消除气象干扰,估计的平均/总污染负荷根据2013—2018年气象基准线分布进行了季节调整。根据线性回归和随机森林的表现和解释性,在基于污染过程的空气质量评估中只考虑了线性回归。针对四个站点群,污染过程秋冬PM2.5和春夏臭氧的平均污染负荷调整前后对比如图2所示。
图2 四个站点群污染过程期间,秋冬PM2.5(左)和春夏臭氧(右)平均污染负荷气象调整前后对比,箱线图描述了污染过程持续时长的分布
尽管污染过程的占比逐年变化,就总体趋势和年度变化而言,基于污染过程的空气质量评估与基于完整的观测数据(包括污染过程之外的观测数据)的空气质量评估,两组结果基本一致,在下降趋势和变化幅度上具有很强的协同作用。以PM2.5为例,图3上下两图分别展示了采用文章提出的评估方法和使用完整的观测数据得到的,与2013年相比,2014年至2020年不同季节平均污染负荷的相对下降。
六种污染物的结果表明,2013年至2020年,四种污染物PM2.5、CO、SO2和PM10的平均污染负荷呈显著下降趋势,其中SO2下降最为显著和持续。在16个季节-站点群组合中,2020年SO2和PM2.5的平均污染负荷显著低于2013年(显著性为5%),下降率范围分别达到37.9%—91.0%和30.2%—81.1%。而NO2的平均下降幅度较小,2020年仅有12个组合呈现显著下降,其中平均下降率仅在12.7%—61.3%。形成鲜明对比的是,自2014年以来,臭氧浓度的季节平均值与2013年相比都出现了大幅上升,2020年春夏和秋冬的增长率分别在24.7%—63.5%和26.8%—283.8%。令人担忧的是,尽管这三个城市的PM—SO2—CO大幅减少,但所有季节污染过程的O3平均污染负荷普遍上升,无下降迹象。
图3 基于污染过程数据(上)和完整的观测数据(下)得到的,与2013年相比,2014年至2020年不同季节平均污染负荷的相对下降
文章分析表明,基于污染过程的空气质量评估在反映浓度的潜在变化方面相比使用整个数据观测的方式更为敏感。其中,臭氧评估最能反映这一点,相对变化幅度远大于使用完整数据的幅度。
虽然这三个城市由于地理位置具有相似的污染-清洁模式,但通过大数据统计方法,可以对其它城市实现自动寻找污染过程、建立数据集,从而得到基于污染过程的空气质量评估结果。尽管重要变量可能因城市而异,但气象调整、平均和总污染负荷的使用可以很容易地拓展。
该论文的第一作者是罗山杉(北京大学大数据研究中心2020级硕士生),另一作者是朱玉茹(北京大学统计科学中心2018级博士生)。文章的通讯作者是陈松蹊教授。本研究得到了国家自然科学基金项目92046021、12026607和12071013的资助。