水文气候学中的极端事件(如高温、干旱、暴雨及寒潮等)往往具有时空运动特征多样(局地生消/跨区域演进)、形态不规则、跨季节以及生消时刻不一、强度变化复杂等多种特征。然而,对这些极端事件的精准识别,可提供反映真实变化的大量极端事件样本,也是后续机理分析的可靠基础。
针对上述极端事件的精准识别问题,Atmospheric and Oceanic Science Letters近日在线发表了题为“3D DBSCAN detection and parameter sensitivity of the 2022 Yangtze river summertime heatwave and drought”研究论文。我系博士后刘臻晨为论文第一作者,周文教授为通讯作者,合作者为国家气候中心袁媛研究员。文章借助非监督学习中经典的DBSCAN(基于密度的噪声应用空间聚类)算法,发展了在三维空间(经度-纬度-时间)内进行目标事件识别和参数敏感性分析的研究方案;针对2022年长江全域高温伏秋旱事件,成功识别本次天气尺度极端热浪和季节尺度极端气象干旱事件的早期信号和时空演变过程。同时,也进行了相关DBSCAN关键参数、维数比等特征敏感性分析,对理解识别结果、算法在其他场景运用也颇有帮助。
具体而言,基于3D DBSCAN算法的事件识别的主要原理与步骤、贡献与展望、其他应用、代码共享等部分进行阐述:
主要原理:
在考虑时空演变的情况下,极端事件相对应的、符合一定阈值条件的三维(经度-纬度-时间)离散格点往往呈现高密度的空间聚集特征。例如,逐日、1°×1°空间分辨率下的日最高气温大于95%阈值的三维格点指标集,于2022年8月中下旬在长江全域呈现高密度聚集特征。那么,这些高密度聚集的三维格点就会被DBSCAN算法识别为一个高密度聚集点簇,即为初步识别的极端高温事件。
识别步骤:
具体为4步:①基于3D DBSCAN算法的三维空间内高密度格点聚类,由此完成考虑时空变化的极端事件初步识别;②考虑事件影响面积和历时的客观筛选,以期选取高强度长历时大范围的极端事件;③离散极端格点的周边中等强度格点再融合,用于补充①中由于特定阈值格点聚类引起的极端信号空间不连续的特征;④搜寻与目标区域和时段重合的事件。这是由于DBSCAN算法本身为非监督学习,所得点簇时空落区不定;因而需要通过计算与目前区域与时段的重合度,实现对所需事件的提取。
主要贡献:
DBSCAN本身算法简单,且scikit-learn提供相应的调用包(通用框架易于维护),维数拓展性好,且解决主要问题所需要的参数少。本论文的主要贡献在于:①完善了一套基于机器学习算法的、考虑时空协同变化信息的极端事件客观识别框架,其主观参数少,“抓大放小”。②提供了基于DBSCAN关键参数min_samples、维数比dimensional scale(longitude-latitude-time)的参数敏感性分析参考方案,为其他场景应用和理解识别结果提供参考。
后续展望:
针对“事件演变过程中的分消和聚合”问题,在本论文中,利用DBSCAN算法中的点簇密度大小来控制,进行简单处理。然而,这部分值得深究:一是因为它在自然界真实存在(如2012年美国大平原干旱演变过程后期,干旱过程分东西两部分别发展),另一方面因为它也是点簇识别追踪的重要技术问题。
其他应用:
3D DBSCAN算法本质是三维空间中的“去噪声”提取研究对象的过程。除此以外,它还可以用于研究对象(如大气河、反气旋、海洋中尺度涡等)的追踪识别,也可以为“旱涝急转”、“暖北极/冷欧亚”等机理研究提供大量更为时空分辨率精细的研究样本。
代码共享:
3D DBSCAN算法示例程序代码链接:https://pan.baidu.com/s/1MCChQT1aNL_BlKh8C-hEgw,提取码:camd。如有使用,直接标注、引用本篇论文即可。如遇技术问题或其他相关探讨,欢迎直接联系作者,增进交流。
图1. 基于3D DBSCAN算法识别所得的2022年夏季长江全域极端高温事件的时空分布特征。(a)极端高温事件在极值时刻的空间分布;(b)极端高温事件的所有受热格点、仅陆地受热格点的面积大小的时程演变;(c)极端高温信号的质心轨迹的空间演变;(d)同期标准化距平强度的时间演变。
基于3D DBSCAN算法识别所得的长江全域2022年夏季极端高温事件的早期信号和时空演变
论文信息: Zhenchen Liu, Wen Zhou, Yuan Yuan, 2023. 3D DBSCAN detection and parameter sensitivity of the 2022 Yangtze river summertime heatwave and drought. Atmospheric and Oceanic Science Letters, 16(4), 100324.https://doi.org/10.1016/j.aosl.2022.100324