冬天到来后,北京和许多中国北方城市都陆续遭受雾霾侵扰,雾霾红色预警屡见报端。一部分城市因为雾霾过重,飞机都无法起降了。媒体报道称,为了驱除雾霾,北京周边 1200 家工厂都采取了减产甚至停产的措施。
2016年,政府和相关部门将配备来自IBM 和微软的预测工具,这两款工具2015年已经经受过严格的测试。其中,北京市政府装备的 IBM 预测工具能将传统的数据源,如分布于北京的 35 个官方空气污染监测站数据和来自环境监测站、公交系统、气象卫星、地形图、经济数据甚至社交媒体的数据进行合并分析。而微软的预测系统则负责整合分布于全国的 3000 个监测站的数据。这两款工具都能将传统的大气化学物理模型与数据统计工具(如机器学习)相结合,以便用更短的时间做出更准确的预测。
“我们的优势其实就是对各方数据的结合,”环境工程师黄巾(音)说道,他是 IBM 北京研究所的绿色地平线项目主管,这个项目的详细内容可见雷锋网此前的报道《IBM机器学习帮助政府势力抗霾》。眼下,IBM 在未来三天雾霾预测准确度上已经超过 80% ,在 7-10 天的预测上精确度也在 75% 左右。
微软现在则负责为中国环保部提供 48 小时的雾霾预测,2015 年时,它在预测北京未来 6 小时内雾霾情况的准确度上已经达到 75% ,而未来 12 小时则可达 60% 。
欧洲哥白尼大气监测服务处主管 Vincent-Henri Peuch 表示,事实上,将物理模型与机器学习相结合来完成空气质量预测是一个非常活跃的研究领域。作为大气科学家,他认为将纷繁复杂的数据相结合是个正确的选择:每种数据都含有重要信息,而且它们并不会相互妨碍。
这种方法也得到了市场的认同,眼下,IBM 的预测工具已经部署在了印度新德里和南非约翰内斯堡,北京一家名为 AirVisual 的新创公司也在为私人用户提供融合了机器学习技术的预测服务。
借助这些预测工具,北京市政府声称已经取得了显著的成效。据政府引用的数据显示,2015 年的细颗粒物污染水平比 2014 年降低了 6% 。
治理雾霾与经济发展不是仇敌,两者必须共生共存,不能偏废。IBM 的预测工具就考虑到了这一点,该系统内置一个模拟器,它可以模拟城市上风口工厂停产和限号出行对城市环境带来的影响。黄巾表示:“IBM 的工具可以估算各种措施下污染排放对经济发展影响的程度。”
AirVisual、IBM 和微软的工具可在不同地区工作,不过它们需要接入当地的物理模型,并输入本地化的数据和可变参数。就拿约翰内斯堡来说,该城市只有 8 个空气污染监测站,“因此,预测工具需要用到南非其他监测站的数据,”计算机工程师 Tapiwa M. Chiwewe 说道。
英属哥伦比亚大学的团队研究发现,根据不同的情况,预测工具需要配合本地化的机器学习算法。该团队认为,不同类型的机器学习花费的计算成本在于预先输入的数据与运行中输入数据之比。对于北京来说,历史空气质量数据的缺乏导致政府必须选择出更合适的系统,只参考其他城市可能无法取得相同的效果。毕竟在数据完全不同的情况下,雾霾预测的效果根本没有可比性。
要想达到世界卫生组织(WHO)制定的空气质量标准,全世界有许多城市还有很长的路要走。2015 年的数据显示,可吸入颗粒物(PM)每年造成的 DALY(伤残调整生命年,指生命年的丧失或有能力的生命年减少)损失达到 1.03 亿。刊登在《柳叶刀》上的 2015 年全球疾病负担研究报告显示,可吸入颗粒物已经成了全世界第六大疾病诱发因素。因此,未来五年内,空气质量监测市场的规模将每年增长 8.5% ,达到 56.4 亿美元。而与其息息相关的空气质量预测市场也会迎来发展的黄金时期。