牛宝体育新闻
牛宝体育《大数据》——美国是怎么运用数据治国的_评论_央视网
本书讲述了美国半个多世纪信息开放、技术创新的历史:奥巴马建设“前所未有的开放政府”的雄心、公共财政透明的曲折、《数据质量法》背后的隐情、全民医改法案的波澜、统一身份证的百年纠结、街头警察的创新传奇、美国矿难的悲情历史、商务智能的前世今生、数据开放运动的全球兴起,以及云计算、Facebook和推特等社交媒体、Web3.0与下一代互联网的未来图景等等。
在微博上看到“7.21”北京暴雨的新闻后,涂子沛连夜写了一篇介绍美国如何发布气象灾害信息的文章。“没有有效的预警大数据,再准确的数据预报也是一个零。”涂子沛在文中介绍到,美国国家天气服务局不仅开通了推特、脸谱等社交媒体账号,还推出了一种叫做天气收音机的预警产品。一旦气象预警后,平时沉默不语的“收音机”会立刻成为“闹钟”。负责短信预警的部门则专门开发了一个系统,能根据用户手机发出的信号,来判别其是否位于暴风或者恶劣天气覆盖的区域,再决定是否发送信息,以提高准确性并减少信息扰民。
“大数据”——这是对信息爆炸时代的崭新描述。它的基本单位是“太”(TB),而1000个太则等于一“拍”(PB)。打个直观的比方,美国国会图书馆是世界上最大的图书馆之一,它所有印刷品的信息量加起来只有15太。而全美国仅在2010年一年的新增数据量就足足有3500拍,这比13亿中国人人手一本1500页的书加起来的信息量还要大。
麦肯锡咨询顾问公司曾做出估测,未来数据仍然会以每50%的速度增长,美国还需要14万至19万名拥有“深度分析数据”专长的工作者。
涂子沛便是其中之一。他会在自己的专栏文章中记录那些数据改变商业的故事:比如,沃尔玛的研究人员通过数据挖掘,发现4成左右的年轻爸爸在购买婴儿尿布时会顺手买点啤酒犒劳自己,便对这两种商品进行了捆绑销售,结果销售量双双增加。更夸张的事例是,一个高中女孩某天突然收到了超市寄来的婴儿服广告,父亲大为光火,但就在超市公开道歉几天后,这位父亲发现自己的女儿真的怀孕了。原来,超市已经可以通过顾客的食品消费数据做出趋势判断。事实上,数据挖掘已经在美国形成了一条完整的产业链,不少大学还设立了相关的硕士学位。
预测未来最好的方法,就是创造未来。而数据最大的价值仍然在预测上面,在解决了数据开放,数据采集,数据质量管理,数据处理后,最重要的作用就是基于数据进行科学的预测和决策。数据竞争将是企业赢之道,一些企业已经将他们商业活动的每个环节放在了数据收集,分析和行动的能力上。
据国家信息中心信息化研究部统计,目前国内提出智慧城市建设的城市总数已达到154个,预计总投资规模达1.1万亿元。但也应该看到,同一些发达国家相比,我国仍然存在这许多不足,区域基础设施不均衡是一个十分突出的问题,投入高收效低的局面使得许多地方的“智慧城市”建设无用武之地,另外,在当下智慧城市中各种庞大的数据都难以实现共享,“信息孤岛”的出现往往会导致成效的大打折扣。
1789年,美国国会制定了《管家法》,规定了行政机关必须在统一的出版物上公开政务信息,但对于公开的内牛宝体育容,行政长官有自由裁定权。进入20世纪后,政府规模不断膨胀,国会先后通过了《联邦登记法》和《行政程序法》,规定公众可以向政府提出信息公开的要求,但如果危及公共利益,政府有权拒绝。
上世纪50年代,哥伦比亚大学的新闻学教授克劳斯对当时的信息管理情况进行了调研,并出版了《人民的知情权》一书。他在书中明确提出:只有拥有信息自由大数据,人民才能真正拥有对公共事务的发言权。但美国的“知情权”牛宝体育,并没有明确的法律保障。所有行政部门的档案盒记录,实际上都处于“准机密”的状态。因为是否属于“机密”,完全取决于当权牛宝体育领导一时的态度。后来这本书被誉为美国信息自由运动的“圣经”。书出版那一年,一个叫约翰摩斯的新任国会议员走进了首都华盛顿。不久后,他提出了《信息自由法》的草案。
直到1966年7月4日,由于参众两院对于该法案的支持率都高于三分之二,无法动用否决权的总统约翰逊在家中签署了这份法案。信息自由胜利的这一天,正是美国的独立日。
如今,仅联邦政府每年就会收到50多万宗信息公开的申请,如果政府以保密的要求拒绝,公民可以提起司法诉讼,法院拥有是否公开的最终裁判权。
2009年1月17日,新任美国总统奥巴马签署了他的首份总统备忘案《透明和开放的政府》。120天后,一个叫做Data.gov的网站正式上线发布。这是一个数据开放的门户网站,旨在全面开放美国联邦政府拥有的数据。
创建Data.gov的价值并不仅仅在于满足民众的知情权。2009年1月,美国联邦政府跨部门工作组曾做出一份报告提供给总统科学技术委员会,该报告这样写道:一组数据,可能会得到数据收集人难以想象的应用,也可能会在另一个看起来毫不相关的领域得到应用,而因为这些创新型的应用,数据的能量将层层放大。
某种程度上,Data.gov的确掀起了一个社会创新的浪潮。截止2011年12月,在这个政府主导的数据开放网站上,汇集了1140个应用程序和软件工具、85个手机插件。其中有近300个应用程序由民间的程序员、公益组织自发开发。 就在Data.gov上线不到一个月的时候,民间的一位程序员便利用美国交通部开放的数据开发了一个航班延误的免费查询系统。
在《大数据》里,涂子沛用可视化图表的形式呈现了2010年波士顿至纽约的航线分钟以内的延误,20%有20分钟以上的延误,还有4%的航班最终取牛宝体育消。如果你打算把航班延误的事情搞清楚,必须使自己能够承受更多的数据冲击。在这条航线上,天气良好的情况下,多数航班会提前5分钟到达;但下雪天的平均延误时间为7分钟;下雨天的平均延误时间则为4分钟。
就“打飞的”而言,出行的时间也至关重要。通常星期六将有78%的最高准点率,而不幸赶上星期一坐飞机的人则要承受30%的最高延误率。而在一天之内,每天早晨5点到6点起飞的航班有83%的最高准点率;而晚上9点到10点的准点率则低达53%。
好消息是,感恩节、圣诞节当天的飞机一般都会准时到达。坏消息则是节日前后的延误情况颇为严重,比如圣诞节次日的平均延误时间就有34分钟,最长需要等待80分钟,更糟的事情则是航班居然有41%的可能性被取消。
当然,这个应用程序最有力度的数据还是一份所有航班的延误大排名,“Delta1807”便以平均延误26分钟成了最不靠谱的航班。
这样的数据挖掘直接给那些落后的航空公司敲响了警钟。其实早在Data.gov之前,国家交通安全局曾经提供过一个“航班等待时间计算器”。后来发现这个民间免费工具如此强大后,交通安全局便知趣地关闭了那个计算器。
联邦政府首席信息官昆德拉在接受媒体采访时,也曾高度赞扬这个由民间开发的第三方程序,认为这正是奥巴马政府希望促成民众共同参与解决社会问题的最好例证。