第1章 绪论
1.1 研究背景与意义
1.1.1 场地污染现状、危害及原因分析
随着城镇化快速发展和产业结构调整,我国城市及周边产生了大量污染场地(王夏晖等,2020),场地土壤污染已经成为亟待解决的生态环境问题(Li et al.,2020)。在美洲、欧洲和亚洲,每天都会检测出污染场地(Brandon,2013;Sigbert et al.,2013)。我国,各省(自治区、直辖市)陆续公布了建设用地土壤污染风险管控和修复名录,涉及污染地块近千个。2014年发布的《全国土壤污染状况调查公报》显示,全国土壤环境状况总体不容乐观,工矿业废弃地土壤环境问题突出,在调查的重污染企业用地及周边的5846个土壤点位中,超标点位占36.3%,工业废弃场地超标点位占34.9%,主要污染物为锌、汞、铅、铬、砷和多环芳烃等,主要涉及化工业、矿业、冶金业等行业。有学者研究了典型城市场地污染情况,以广州市为例,该市污染场地主要遭受无机物和有机物的复合污染,污染物类型主要为重金属、氰化物、氟化物和有机物(谭海剑等,2021)。部分场地污染时间长(超过30年)、面积跨度大(10 000~300 000m2),污染较为复杂,污染程度严重,如某制气厂地块涉及苯系物、多环芳烃、石油烃等近20种污染物,污染深度达24m,地下水同步受到污染,再如某涂料厂乙苯超标高达30 000多倍、某香料厂污染面积占场地面积的54%以上(吴俭等,2021)。另外,以北京市为例,该市的26个污染场地中,11个为挥发半挥发性有机污染场地,3个为农药污染场地,3个为重金属污染场地,9个为复合污染场地,主要污染物类型为挥发半挥发性有机物(氯代烃、苯系物和多环芳烃)、农药(六六六和滴滴涕)和重金属(铬、铅、汞、铜、镍和锑等)(马妍等,2017)。土壤中污染物容易在风力或水力作用下进入大气和水体,引发大气污染、地表水污染、地下水污染和生态系统退化等次生环境问题。土壤是重金属入侵人体的主要途径之一,重金属通过食物链进入人体后会造成骨损伤、神经毒性、心血管损伤及癌症等疾病(黄芸等,2016)。
总体来看,我国场地污染情况并不乐观,污染场地数量多、污染成因复杂、溯源难度大,涉及行业广,给我国生态环境、经济发展和人体健康带来了巨大挑战,已成为生态文明建设和美丽中国建设的短板。
1.1.2 我国场地污染风险管理进展
近几年,我国确定了“风险管控”的场地污染风险管理思路,先后印发实施了《污染地块土壤环境管理办法(试行)》(环境保护部令第42号,2016年)、《土壤环境质量 建设用地土壤污染风险管控标准(试行)》(GB 36600—2018)、《污染地块风险管控与土壤修复效果评估技术导则(试行)》(HJ 25.5—2018)、《建设用地土壤污染风险管控和修复监测技术导则》(HJ 25.2—2019)等,提出了污染识别、调查评估、风险管控、效果评估等方面的管理和技术要求(表1-1)。另外,2019年1月1日起施行《中华人民共和国土壤污染防治法》,填补了我国场地污染风险管控领域的立法空白。
表1-1 我国场地污染识别与风险管控政策、法律、标准、规章、导则一览表
1.1.3 场地大数据
1.场地大数据特点
目前,大数据的基本特征包括数据量大、类型繁多、价值密度低、产生速度快。数据量大指大数据的采集、存储和计算量非常大,起始计量单位至少是拍字节(PB)、艾字节(EB)或泽字节(ZB)级。类型繁多指大数据种类和来源多样,包括结构化、半结构化和非结构化数据,其中非结构化数据占80%以上(图1-1),具体表现为文本、报告、网络日志、音频、视频、图片、地理位置信息等。价值密度低指大数据蕴含信息量大,但有价值的信息少,需要结合业务逻辑(logit)并通过强大的智能算法来挖掘数据价值。产生速度快指数据增长速度快,处理速度也快,时效性要求高,如搜索引擎要求数分钟前的新闻能够被用户查询到,个性化推荐算法尽可能要求实时完成。
图1-1 我国场地污染数据结构
在生态环境领域,通过多年积累,已初步形成场地污染相关海量数据。场地污染大数据除具有传统大数据的特征外,还具有高维性、高复杂性、高不确定性的“三高”特性(Guo et al.,2014;蒋洪强等,2019)。
1)高维性指数据来源包含反映自然与社会现象之间的多维数据。场地污染大数据可通过土壤、空气、水、噪声环境质量监测设备来感知,还可以通过生物传感器、化学传感器、射频识别技术、卫星遥感、视频、光学传感器、人工检查等感知。
2)高复杂性指场地污染大数据内在类型、结构及模式具有复杂性。高复杂性使得场地污染大数据的表达、理解和计算等多个数据挖掘环节面临巨大挑战。场地污染大数据本身价值密度较低,只有通过数据清洗、集成、建模、可视化等步骤才能将这种复杂、非结构化的数据转化为有价值的信息。
3)高不确定性指数据采集时可能存在错误或不完整,数据处理时出现的不确定性概率较高。场地污染大数据来源于不同部门,数据标准、规范不统一;通过不同网络爬取工具获得的数据格式具有多样化;各部门数据共享程度较低,同一指标数据缺乏一致性。
2.场地大数据来源
我国污染场地数据来源广泛,主要包括三个渠道:一是政府数据,如土壤背景值调查、全国土壤污染状况调查、全国土壤污染状况详查、多目标区域地球化学调查、农产品产地土壤重金属污染普查、全国污染源普查等调查数据,以及环评审批、环保验收、信访举报、排污许可、营业执照审批、企业工商等掌握的土壤、地下水、重金属、有机物、企业名称、地理位置等数据;二是开源数据,如在中国科学院数据云、地理空间数据云、地理国情监测云等云平台共享的土地利用、土壤类型、地形、地貌、遥感、水文、水文地质、降水、道路、人口、经济、学术论文等数据;三是网络数据,在互联网(internet)、物联网、移动互联网上获取的舆情、企业基本情况、污染突发事件、谷歌和百度地图兴趣点(point of interest,POI)等数据(王夏晖,2019)。
1.2 大数据支持场地污染风险管控进展分析
1.2.1 大数据支持场地污染风险管控的数据挖掘
基于Web of Science数据库,检索出2010~2020年的17 860篇大数据文献和656篇大数据支持场地污染风险管控文献,分别利用词频高于20次和10次的关键词绘制研究热点与结构图。不难看出,大数据领域的研究热点主要有机器学习(machine learning)、物联网(internet of things)、深度学习(deep learning)、人工智能(artificial intelligence)、云计算(cloud computing)、数据挖掘(data mining)、数据模型(data model)、区块链(blockchain)等(图1-2)。在此基础上,围绕土壤和地下水中污染物特别是重金属,人工神经网络(artificial neural network)、深度学习、机器学习[如支持向量机(support vector machine,SVM)、随机森林(random forest)]等支持污染预测、污染源识别、水质分析、风险评估的技术得到了较多关注(图1-3)。
图1-2 大数据领域的研究热点与结构
图1-3 大数据支持场地污染风险管控的研究热点与主题结构
1.2.2 大数据支持场地污染识别
目前,基于现有场地污染调查有关技术方法,不论是区域还是地块尺度上,由点及面的土壤污染浓度识别可能产生与实际偏离较大问题,已经不能满足日益增长的精细化环境管理需求。近年来,基于大数据的相关关系内涵和大数据深度挖掘,利用已知有限点位的土壤数据并借助多源辅助数据,成功实现了土壤污染及其属性的浓度和空间分布识别,取得了较好效果(Chen et al.,2019;Pyo et al.,2020;Cao and Zhang,2021)。例如,借助98个土壤样品、1960个测试点位数据,围绕野外现场快速检测的可见红外光光谱(350~2500nm),基于卷积神经网络、配有卷积自编码器的卷积神经网络、人工神经网络、随机森林、人工神经网络+主成分分析、随机森林+主成分分析6种算法,建立基于大数据的土壤As、Cu、Pb浓度快速检测方法,其中配有卷积自编码器的卷积神经网络的准确度*高(Pyo et al.,2020),为研制新型的场地
展开