随着全球空气污染问题的日益严重,颗粒物(PM2.5和PM10)对人体健康的影响成为近年来学者重点关注的内容之一。PM2.5和PM10是指空气中直径小于或等于2.5微米和10微米的颗粒物,它们可以深入人体呼吸系统,增加心血管疾病、呼吸系统疾病甚至癌症的风险。然而,传统的颗粒物监测设备价格昂贵,不利于大规模部署和长期使用。因此,开发低成本、高精度的颗粒物传感器设备具有重要的实际应用价值。 研究方法 复旦大学公共卫生学院赵卓慧、上海市环境监测中心蔡云飞联合上海大学高松研究团队在上海进行了为期一年的室外环境和两个月的室内环境的平行测量,比较了传感器设备与传统仪器的测量结果。研究使用了六种不同的机器学习模型,包括多元线性模型(ML)、K最近邻模型(KNN)、支持向量机模型(SVM)、决策树模型(DT)、神经网络模型(MLP)和随机森林(RF)模型,对传感器设备的测量数据进行优化。通过大量的实地测量数据,训练和比对发现随机森林(RF)模型以其出色的准确性和稳定性脱颖而出。 室内环境颗粒物传感器应用效果 在室内环境中,传感器的性能经过六种机器学习模型的优化后,结果显示随机森林(RF)模型以PM2.5和PM10的R²值分别为0.97和0.91,提供了最佳的测量准确性和稳定性。这一结果优于多元线性模型(ML,PM2.5和PM10的R²分别为0.66和0.64)、K最近邻(KNN,R²分别为0.93和0.84)、支持向量机(SVM,R²分别为0.85和0.77)、决策树(DT,R²分别为0.95和0.85)和神经网络(MLP,R²分别为0.90和0.80)模型。这些数据表明,在室内环境中,RF模型对传感器数据的解释和预测能力最强,使得传感器能够提供与参考仪器相媲美的测量结果。 室外环境颗粒物传感器应用效果 在室外环境中,随机森林(RF)模型同样展现出优越的性能,对PM2.5和PM10的R²值分别达到0.90和0.80,明显优于ML模型的0.79和0.26、KNN模型的0.83和0.76、SVM模型的0.85和0.23、DT模型的0.84和0.59以及MLP模型的0.84和0.41。这些结果证实了RF模型在处理室外环境复杂性方面的优势,尤其是在调整了温度、相对湿度和PM2.5/PM10比率等气象因素后,进一步提高了传感器设备的测量准确性。 ![]() 图1 机器学习模型优化 综合比较,无论是在室内还是室外环境,随机森林(RF)模型都以其最高的R²值和最低的均方根误差(RMSE)证明了其在优化传感器设备性能方面的较高能力,为提高传感器监测数据准确性和可靠性方面的提供了重要价值。 传感器与标准仪器测试结果可比对 经过RF模型优化后的传感器设备,在室内外环境中对PM2.5和PM10的测量结果与标准仪器的对比显示,相关系数(R²)分别达到了0.97和0.91(室内)以及0.90和0.80(室外),均方根误差(RMSE)也控制在了一个较低的范围内。表明优化后的传感器设备能够提供高精度的测量结果,满足环境监测的需求。 在室内环境中,传感器设备的测量结果与TSI仪器的测量结果非常接近,相关系数达到了0.96以上。在室外环境中,传感器设备的测量结果与TEOM仪器的测量结果也显示出良好的一致性。此外,研究还发现,传感器设备在不同季节和不同污染水平下的测量性能均表现出色。 ![]() 图2室内环境的五种场景下,PM2.5和PM10(µg/m3)传感器和参比仪器TSI(黑线)平行测量 ![]() 图3 室外环境场景下,PM2.5和PM10(µg/m3)传感器和参比仪器TEOM(黑线)的平行测量 综上所述,颗粒物传感器监测技术通过多种机器学习方法应用与优化,可以显著提升颗粒物传感器设备的性能,使其在室内外环境中对PM2.5和PM10的测量精度均有明显提高,并且优化后的传感器设备在室内外环境中均展现出了高准确性和应用效果。这项研究不仅提升了颗粒物传感器设备的性能,也为环境监测和流行病学研究提供了新的技术支持。未来应用低成本、高效率的传感器监测设备,将有助于更广泛地收集空气质量数据,为进一步评估环境空气质量、人群暴露风险等提供技术支撑。 参考文献: Tang, H., et al., Multi-Scenario Validation and Assessment of a Particulate Matter Sensor Monitor Optimized by Machine Learning Methods. Sensors (Basel, Switzerland), 2024. 24(11): p. 3448. |
|