省时省力 精准测算 看大数据如何应用于环境管理

10.08.2015  14:36

  大数据可以找出看似不相关数据的关联性,实现不确定加不确定等于确定的效果,在大数据时代,这一确定性将不断精确。下面看看大数据在环境领域的应用会产生哪些“魔法”,是不是会令你脑洞大开?

  ■精细预测空气质量

  以往,空气质量状况只能通过空气站点得知,一旦这个地方没有建设空气质量监测点,就无法获知具体的空气质量数值。而由于空气质量受多种因素的影响,每个区域的空气质量各不相同。就北京来说,六环内的35个空气质量站点远远无法反映整个北京的空气质量状况。但传统空气质量监测站点的建设需要投入大量的财力、物力和人力。

  应用大数据方法,微软与环保部门合作研发的U-Air便可以分析和预测城市细粒度1km×1km范围的空气质量。这主要通过融合两类数据来实现,第一类数据是空气质量监测实时数据和历史数据,第二类数据是空气质量相关性数据,包括气象数据、交通数据、人流数据、道路结构数据、兴趣点。通过对这些数据建立模型,可以查看任意点位之前6小时的空气质量状况,并预测6~12小时、12~24小时的空气质量状况。

  U-Air已在61个城市进行验证,平均准确度比传统方法高出7个百分点。北京的准确度可以达到75%,广州和深圳可以达到80%。

  从精度来说,目前U-Air可以实现1km×1km的细粒度的空气质量预测,未来,空气细粒度将越来越细。

  从计算速度来说,只要花费几秒钟,U-Air就可以实现全市空气质量的预测。

  由此,从准确度、精度、速度来说,基于大数据研发的城市细粒度空气质量模型远远超越传统空气质量模型。

  ■计算尾气排放量

  过去一个小时,北京市路面上总油耗是多少?这些油耗将产生多少PM2.5和PM10?没有大数据之前,这基本上无法回答。但在大数据看来,便是小菜一碟。

  利用车辆的GPS轨迹,结合历史数据、路网和天气,可以计算路面速度,之后通过速度推算出流量,最后根据平均排量,算出总能耗和排放量。

  就北京来说,通过对北京每一条道路过去10分钟的车速、流量、排放进行实时估计,就可以通过机器学习和数据挖掘,计算出北京十几万条路在过去10分钟的总排放量。

  机动车能耗状况的掌握有利于优化交通路线设计,也可以帮助相关部门进行决策,比如可以将单双号限行具体到某一条路线或者某个区域。加入站点监测数据,还可以计算尾气排放量在空气质量中的占比情况

  ■计算区域噪音指数

  纽约长期被噪音污染困扰,但噪音具有实时性,并且不同人不同时间对噪音的感知不同,所以对噪音的监管非常困难。

  计算区域噪音指数需要解决3个问题,即纽约什么地方有噪音、什么样的声音算噪音以及这个地方为什么有噪音。如果用传统添加硬件的方法进行解决,整个纽约市至少需要一百多万个噪音传感器,显然这并不可行,并且噪音传感器只能反映分贝数,无法与公众感受结合起来。

  郑宇的大数据团队则注意到与噪音相关的周边数据。纽约有一部311电话,用于市民投诉,这是公众感受的重要数据源。于是,郑宇团队对311的数据进行了整合,对噪音投诉的时间、地点、类别、次数、性质进行了整理,通过与道路结构、兴趣点、人的社交媒体数据进行融合,计算出每个区域每段时间噪音指数,反映了公众对噪音的整体感受情况。

  纽约城市噪音模型可以回放24小时任何时间任何地点的噪音污染情况,并直接显示噪音污染区域的排名情况。