浙江农业科学 ›› 2017, Vol. 58 ›› Issue (7): 1269-1272.DOI: 10.16178/j.issn.0528-9017.20170756

• 资源与环境 • 上一篇    下一篇

基于随机森林的温瑞塘河总氮模拟与预测

王学东1, 2, 黄宏1, 2, 梅琨1, 2, 商栩1, 2, 夏芳1, 2, 王振峰1, 2, *   

  1. 1.温州医科大学 浙南水科学研究院,浙江 温州 325035;
    2.浙江省流域水环境与健康风险研究重点实验室,浙江 温州 325035
  • 收稿日期:2017-03-01 出版日期:2017-07-15
  • 通讯作者: 通信作者:王振峰(1983—),男,湖北荆州人,助理研究员,博士,研究方向为水环境保护,E-mail: wangzf@iwaterlab.com
  • 作者简介:王学东(1967—),男,河南淮阳人,研究员,博士,研究方向为环境化学,E-mail:zjuwxd@163.com。
  • 基金资助:
    温州市水体污染控制与治理科技创新项目(S20140041,S20140040,S20140039,S20140038,S20140037)

  • Received:2017-03-01 Online:2017-07-15

摘要: 为快速获得水体中总氮含量,采用随机森林方法建立总氮预测回归模型。结果显示,较少的数据异常值仍会造成随机森林模型较大的误差,去除4.6%的异常值后,模型均方根误差(MSE)降低了42.4%。随机森林模型可对自变量的相对重要性做出评估,对总氮而言,最重要的变量是氨氮,模型2个主要参数随机树数量(ntree)和随机分割变量数(mtry)的值分别为400和2。在选择合适的参数值时,随机森林模型不易出现过拟合显示,建立的随机森林模型可以快速预测水体中总氮的含量。

关键词: 随机森林, 回归模型, 温瑞塘河, 总氮

中图分类号: