2000年-2023年中国湖泊与水库高分辨率逐月水质数据

数据介绍

水质参数(pH、溶解氧(DO)、总氮(TN,包含有机氮和无机氮)、总磷(TP)、高锰酸盐指数(CODMn)、浊度(Tur)、电导率(EC)和溶解有机碳(DOC))是评估湖泊水库生态健康的关键指标。本研究通过随机森林(RF)模型,融合气候、土壤属性及流域人类活动等多维驱动因子,构建了2000-2023年间中国近18万个湖泊水库上述水质参数的月度动态数据集。模型有效捕捉了水质参数的时空变异特征,其相关系数(R²)介于0.65至0.76之间。值得注意的是,研究期间全国湖泊Tur和EC呈显著上升趋势,而pH、DO等参数波动较小。该数据集为深入评估水生生态系统的环境功能与气候响应机制提供了重要基准。

图片

图1、中国湖泊和水库的地理分布,以及本研究中使用的中国国家环境监测总站(CNEMC)和DOC观测站

图片

图2、中国湖泊和水库月度水质数据生产流程图。输入数据名称的缩写解释如下:CSoil,土壤有机碳;RSoil,土壤呼吸速率;Napp,氮肥施用量;Ndep,氮沉降;Pop,人口;Cropland(耕地)、Forest(森林)和Grassland(草地),分别代表土地利用类型中耕地、森林和草地的比例。

数据与方法:

2000年-2023年中国近18万个湖泊与水库的水质数据(高分辨率/逐月/含经纬度)

数据来源:

水质数据:217个国家级自动监测站(2021-2022年)与83个站点的DOC观测数据(2017-2022年)

驱动因子:整合28项数据,包括气候(ERA5再分析数据)、土壤属性(有机碳、pH等)、人类活动(氮肥施用、人口分布等)

地理数据:中国水库数据集(CRD)、全球湖泊数据集(GLAKES)及流域划分数据

模型构建:

  • 采用随机森林(RF)模型,按月分参数建立预测模型

  • 输入变量:通过逆距离加权法计算各流域内气候、土壤和人类活动因子的空间影响

  • 验证方法:70%数据训练,30%测试;使用R²、RMSE、MAE评估模型性能

数据预览

图片

图片

数据年份:2000年-2023年

数据格式:它们被整理成CSV文件格式,每个文件包含各湖泊和水库从2000年至2023年的ID编号、经纬度坐标,以及pH值、溶解氧(DO)、溶解性有机碳(DOC)、总氮(TN)、总磷(TP)、高锰酸盐指数(CODMn)、浊度(Tur)和电导率(EC)的月平均值。这些文件根据水体类型以及年月来命名。

数据容量:3.78GB

Logo

GitCode 天启AI是一款由 GitCode 团队打造的智能助手,基于先进的LLM(大语言模型)与多智能体 Agent 技术构建,致力于为用户提供高效、智能、多模态的创作与开发支持。它不仅支持自然语言对话,还具备处理文件、生成 PPT、撰写分析报告、开发 Web 应用等多项能力,真正做到“一句话,让 Al帮你完成复杂任务”。

更多推荐