Welcome to WUST,You are using IPv6 to access this website!
文章摘要
基于改进集成学习算法的在线空气质量预测
Online air quality prediction based on improved ensemble learning algorithm
投稿时间:2018-09-22  
DOI:
中文关键词: 空气质量预测  XGBoost算法  衰减函数  Bagging  集成学习  特征选择  PM2.5  AQI
英文关键词: air quality prediction  XGBoost algorithm  attenuation function  Bagging  ensemble learning  feature selection  PM2.5  AQI
基金项目:国家自然科学基金资助项目(61273225,61702381).
作者单位E-mail
夏润 1.武汉科技大学计算机科学与技术学院,湖北 武汉,430065
2.武汉科技大学智能信息处理与实时工业系统湖北省重点实验室,湖北 武汉,430065
3.武汉科技大学大数据科学与工程研究院,湖北 武汉,430065 
1148489428@qq.com 
张晓龙 1.武汉科技大学计算机科学与技术学院,湖北 武汉,430065
2.武汉科技大学智能信息处理与实时工业系统湖北省重点实验室,湖北 武汉,430065
3.武汉科技大学大数据科学与工程研究院,湖北 武汉,430065 
 
摘要点击次数: 4458
全文下载次数: 3050
中文摘要:
      为了实现空气质量的在线预测,提出了一种基于XGBoost算法的改进集成学习算法OPGBoost。首先对PI(plant information)实时数据库系统进行二次开发,构成大数据挖掘与分析平台,运用数据融合工具对原始数据进行预处理,并采用Boruta算法进行特征选择,从而构造出包含更多属性特征量的有效数据集。然后对XGBoost算法中的一阶和二阶导数进行优化,并通过时间滑动窗口和衰减函数机制获取训练数据以及训练模型的权重,最后采用Bagging集成学习策略构成OPGBoost组合模型。实验结果表明,针对基于PM2.5浓度和AQI表征的空气质量预测,本文方法与4种已有算法相比在准确性和实用性方面具有明显的优势,能够较精确地预测未来1、12、24 h的空气污染情况。
英文摘要:
      For online prediction of air quality, this paper presents an improved ensemble learning algorithm named OPGBoost on the basis of XGBoost algorithm. Firstly, PI (plant information) real-time database system is redeveloped to form a systematic big data mining and analyzing platform. Original datasets are pretreated by data fusion tools and their important features are selected by Boruta algorithm in order to construct valid datasets with more attribute properties. Secondly, first and second derivatives in XGBoost algorithm are optimized, and time sliding windows and attenuation function mechanism are used to obtain the training data and the weights of trained models. Finally, the combined model OPGBoost is constituted by using Bagging ensemble learning strategy. Experimental results show that, compared with four existing algorithms, the proposed method has obvious advantages in accuracy and practicality, and can forecast the air pollution characterized by PM2.5 concentration and AQI in the next 1,2, 24 hours quite accurately.
查看全文   查看/发表评论  下载PDF阅读器
关闭