国家信息中心于施洋:政务大数据何以“舍近求远”?

政务大数据发展的“农村包围城市”迂回式策略,先以挖掘互联网上免费、公开的数据为主,再向政府内部走,可谓另辟蹊径,别有洞天。

于施洋,国家信息中心信息化研究部副主任,电子政务研究者

于施洋,国家信息中心信息化研究部副主任,电子政务研究者

于施洋现任国家信息中心信息化研究部副主任。他毕业于北京大学政府管理学院,师从汪玉凯教授,获管理学博士学位。2001年,赴美国麻省理工学院做访问学者。2002年起,他开始专注于电子政务研究,参与过多项国家电子政务政策、规划的起草和研究,可谓见证了我国电子政务近十余年的发展历程。

大数据助力政府网站转型

从2011年5月起,于施洋所带领的团队从以往主要关注的电子政务政策和规划研究领域“华丽转身”,以事企合作创新方式成立了国家信息中心网络政府研究中心,开始专注于政务网站大数据分析。

这一研究中心已经成为国内首屈一指的政府网站大数据中心。2014年2月,中央政府门户网站改版的大数据分析和栏目规划、页面设计就由该团队完成。

回顾这一转变时,于施洋坦陈,他本科学经济学、硕士学金融,博士学行政管理,可以说都跟信息技术、数据科学无关。但当时就是一种强烈的使命感,驱使他毅然放弃了“高大上”的战略和政策研究,而带领团队扎到数据分析这个专业领域。

于施洋认为,网络的快速普及,意味着我国社会发展的人文基础正发生根本性变化。互联网不断进化,政府网站却后知后觉。政府网站无法为网民提供有效服务的原因之一,就在于政府主观想象出来的服务供给和网民实际需求之间的严重错配。

他认为,政府网站未来将有“三大转变”:从“知晓式”被动信息发布,向“回应式”主动公开转变;从“单向式”表达,向“融入式”参与决策转变;从“形式化”在线服务,向“实质性”网上办事转变。

而这一切转变发生的基础,就是大数据。

政务大数据从互联网上突破

2015年2月,于施洋又有了新任命:国家发改委互联网大数据分析中心执行副主任,这是他职业生涯的又一次转变。

谈到这段经历,于施洋提出了一个有意思的观点。他认为,政务大数据发展大致有两条路径:一条是由内而外,先占领“大城市”的直达式路径,先以政务信息共享、公开为主,再与互联网海量数据结合;另一条是由外而内,“农村包围城市”的迂回式策略,先以挖掘互联网上免费、公开的数据为主,再向政府内部走。从过去一段时间实践看,第一条路线看似更直接,但并不好走、风险很高;而第二条路虽然看似“舍近求远”,但实际上却是另辟蹊径、别有洞天。

研究表明,2011年全球数据总量约1.8ZB,到2020年则将激增到40ZB,这其中文本、图片、音视频等非结构化数据占比将达到75%,而这其中的绝大多数数据并不由政府产生,也不掌握在政府手中,而是在互联网、物联网。

那么,完全基于互联网上开放、公开的数据,是否可以直接建立一套国民经济运行的非统计监测预测和决策支持体系呢?基于这样的考虑,2015年4月,国家发改委正式批准成立了互联网大数据分析中心。值得注意的是,国家发改委在中央各部委里首提建设大数据专门机构,还批准建设专项,成立了超100人的专业团队。

实际上,从一开始,“互联网思维”就深扎于“互联网大数据分析中心”。

一方面,强调用开放、合作、创新、共享的思路来建设大数据中心,而不是一上来就闷起头在政府内部去推信息共享。过去一年,这个机构探索性地开展了基于互联网非统计数据的宏观经济监测、预测研究和分析工作,研发了网民经济信心指数、重点消费领域需求指数等十多个指数,在基于互联网大数据开展国民经济运行监测预测方面,探索出了一条支撑宏观决策的全新路径。

另一方面,强调真正做到问题导向、应用为先、机制创新。2015年2月9日,国家发改委决定建设互联网大数据分析中心,两天后,他们的第1期分析报告就报送上去了。截至目前,他所带领的团队围绕经济监测、形势分析和政策评价,编写完成了140多期大数据分析报告,处理有效数据条数超3000亿条。

事业单位与企业合作的PPP模式,是一种机制创新。于施洋说,教训太多了,技术、需求瞬息万变,如果还像以前那样,用1-2年立项、再用1年建设,然后才考虑利用系统开展工作,那么,等大数据系统建成之时,需求已变化、技术早就过时。

实际上,在从“外围”互联网入手的同时,近期他的团队已经开始在税务、工商、生态等领域逐步深入到政府业务数据之中,实现了由外而内的突破。

国家信息中心于施洋:政务大数据何以“舍近求远”?

走出国门建大数据中心

2015年底,于施洋和他所带领的团队又接受了一个新的使命,组建国家信息中心“一带一路”大数据中心。这是全新的任务,于施洋透露,在领任务之初,他们曾经做过调研,发现“一带一路”沿线60多国一共有40多种官方语言,建立一个覆盖一带一路沿线国家的数据采集、分析和决策支持体系,光是跨语言翻译问题就是一道过不去的坎。

面对这样一个艰巨的任务,团队依然沿用了在发改委互联网大数据分析中心时采用的事企合作、广泛整合各方资源的模式,快速启动了“一带一路”国别数据库和大数据综合服务门户建设;并与海南、新疆、福建等地方政府签署了战略合作协议,共同推进一带一路大数据应用工作。此外,“一带一路”大数据中心还与哈萨克斯坦政府初步达成协议,计划在哈萨克斯坦首都建设中亚“一带一路”大数据区域分中心。后续还会在斯里兰卡、马来西亚等地建设分中心,最终形成一个全球化、多节点的大数据采集分析应用体系。

在一篇研究论文中,于施洋写道,大数据之“大”,不仅仅在于其容量之大、类型之多,更重要的意义在于用数据创造更大的公共价值,从这个意义上说,“只有把大数转化成为有决策参考价值的小数据,才是它 最后的、最终的归宿。”

对话于施洋

涂子沛频道:职业生涯中印象最深刻的一件事是什么?

于施洋: 2014年11月底的一天,我的主管领导国家信息中心常务副主任杜平同志召集大数据业务骨干开了一个会。在会议上杜主任传达了发改委徐绍史主任的三句话,大意分别是:第一句,大数据是大机遇,是未来国家信息中心的核心业务之一;第二句,大数据是国家发改委机关定位转型的重要抓手,要真抓实干;第三句,指示我们围绕发改委核心工作制订建立基于互联网大数据的非统计宏观决策支持休系的总体方案。现在回过头看,这些论断和指示都是前瞻性的、战略性的,对于我们这些年青人是很大的鼓励。从那天开始,我们这个团队在大数据支撑宏观决策领域正式起航。

涂子沛频道:关于大数据,您正在进行的工作是什么?

于施洋:我在大数据领域的工作经历了三个阶段。第一阶段是从2011年到2014年底,主要是通过网民访问行为大数据分析帮助政府网站提升为民服务的能力;第二个阶段是从2014年底到现在,重点是利用互联网数据建立国民经济运行的非统计监测预测和决策支持体系,我们在数据汇聚、数据模型、数据可视化等领域进行了积极探索;第三个阶段,就是未来两到三年,把互联网数据和政府业务数据有机结合起来,全面提高大数据在决策、监管、服务等各个领域的应用。

涂子沛频道:对于大数据的未来,尤其是您正在从事的领域有什么样的展望?

于施洋:大数据在政府中的应用目前还处在起步期,未来发展空间十分广阔。我认为,从过去五年的工作实践看,未来政府大数据应用有两个方面需要突破:一是机制创新,现行的电子政务建设、管理和运维机制与大数据工作特性之间的矛盾越来越突出。机制问题不解决、不突破,大数据就可能走电子政务的老路,失败率甚至可能更高。二是人才培育,人才紧缺已经成为制约政府大数据应用的首要瓶颈。我觉得在人才和知识的储备上,在人才的使用和激励上,政府还有很多工作要做。培养既懂大数据、又懂政府业务的人才,是个大课题。

【文/涂子沛频道研究员 葛育民  来源:涂子沛频道微信号:dsjtzp】

氧分子网(www.yangfenzi.com)是关注互联网生态圈的科技新媒体

·氧分子网(http://www.yangfenzi.com)延伸阅读:

➤  电子科技大学互联网科学中心主任周涛:你也可以成为数据魔法师
➤  四川师范杀人惨案后,大数据该如何预防犯罪为社会治理服务?
➤  大数据时代中国数据量有多大?
➤  侯锷:国内政务新媒体发展格局与趋势
➤  深度解读:听云重磅发布《2015中国移动应用性能管理白皮书》
➤  未来论坛《理解未来》讲座走进京东:大数据驱动下的变革
➤  阿里巴巴高红冰:中国为什么会出现“互联网+”热潮
➤  告别小时代,大数据为我们带来了什么?
 曙光总裁历军:大数据网络是信息技术最大的推动力

分享给您的好友:

您可能还喜欢…

  1. 今天分享的内容是老周对大数据的看法,大数据与云计算是人工智能发展的重要基础,老周会怎么看大数据?

    一起来看看吧!

    大数据概念最火的时间是2011年到2014年,后来它的风头被人工智能和虚拟现实盖过。那么,2016年之后,大数据还算不算个“东西”呢?我觉得有必要谈一下。

    大数据已经不太可能成为曾经那个世人瞩目的炒作题材了,凡是火了一段时间之后仍然能够引起大众兴趣的产品或服务,通常都可以被大家接触和感知到,像移动应用、可穿戴智能设备、社交网络等。大数据更像是管道设施,虽然重要,但无法被大家看到。大数据的核心是企业技术:数据收集、存储、分析等,这些都是在后端发生的,只有技术人员可以看见。

    大数据概念的盛行,主要是受到了一些主流互联网公司的推动,比如谷歌和脸书,他们自己本身就是大数据技术的重度用户,同时也在推动这项技术发展。后来随着开源运动的迅速发展,促使大数据领域的新技术共享到更广的范围,这为互联网大公司的工程师离职去做大数据相关的创业提供了有利条件。

    随着一些崭露头角的“独角兽”公司,以及更多胸怀大志、运营良好的中等规模的公司也开始面临大数据技术需求,由于它们自身不具备大数据的基础设施,所以自然就成为大数据企业的第一批客户。大数据行业初期的成功引发了更多的创业活动,也带来了资本的进入,大数据因此顺势而起。

    这样发展了一段时间之后,大数据领域也随之出现了更加棘手的问题,就是让跨国公司级别的企业采用大数据技术。为什么说它棘手呢?因为这些公司基本上不是“数字原生”的公司,它们也不具备有利条件。这些公司现有的技术基础设施都是成熟的,在传统的模式下不会犯错,但它们未必是功能完备的。

    我们知道,一个规模庞大企业的管理人员都具备前瞻性,他们都认为对自己企业遗留的基础设施进行现代化改造越早越好,但出于谨慎,他们不会一夜间就把自己的关键环节弃而远之。大企业之所以会如此谨慎,有两方面原因:一是大数据公司普遍为初创企业,大企业对由年轻的公司来处理自己的基础设施难免感到不放心;二是大企业对于安全的担忧,大多数企业都会拒绝把数据迁移到云端。

    从大数据行业的内部来看,大数据的成功不是由实现技术的某一方面而实现的,它需要把技术、人和流程糅合到一起,收集数据、存储数据、清洗数据、查询数据、分析数据和对数据进行可视化等工作是有分工的。有的由机器来完成,有的需要人来做,但是整体是要无缝集成起来的,也就是说,以数据为中心,公司整体以数据为驱动。

    对于大数据的发展,我把它分为下面5个阶段。

    1. 部署阶段

    2011~2013年,互联网公司开始实验大数据技术,推出了若干的Hadoop试点计划或者尝试一些试点方案,由此出现了诸如“数据科学家”和“首席数据官”等此前并不存在的职位。他们做了很多努力,但是依然没有出现足够多的、可以展示的成果。此时,更多的公司对大数据技术持观望态度,它们寄望于某个大型供应商可以提供一个一站式解决方案,比如IBM,但这种情况并没有出现。

    2. 生态体系正在成熟

    当一部分大数据企业完成了融资,企业规模得到了扩大时,更重要的是它们从早期的失败中获得了宝贵的经验,已经可以提供成熟、经受过考验的产品。其中的佼佼者已经成功上市,比如2015年上市的Hortonworks,没上市的也已经获得上亿美元融资,在资金方面看起来不会显得那么单薄,比如Cloudera。

    随着大数据领域的创业持续进行,公司的数量与日俱增。行业的基本趋势也慢慢发生了变化,大数据业务的中心从基础设施(开发者和工程师)转移到了数据分析(数据科学家和分析师),甚至在应用方面也已经初露端倪。

    3. 大数据基础设施持续创新

    尽管大数据的重心已经转移,但是基础设施领域的创新仍然富有活力。2015年,Apache Spark大热,这个利用了内存处理的开源框架受到了IBM、Cloudera等企业的拥护。

    Apache Spark 的出现解决了一些导致Hadoop采用放缓的关键问题:Apache Spark数据分析更快,更容易编程,并且跟机器学习能够很好地搭配。

    在数据库领域内,也出现了很多新兴玩家,出现了很多令人兴奋的技术进步,比如图形数据库的成熟、专门数据库的出现,比如统计时序数据库InfluxDB。此外,数据仓库也在不断演变。

    4. 大数据分析与人工智能结合

    大数据分析越来越关注利用人工智能来帮助分析大规模的数据。其实,有很大一部分人工智能在某种程度上来说是大数据的产物,深度学习概念在10年前提出,而其背后的算法在几十年前就诞生了,但它真正发挥出最大的潜能还是在应用到大数据之后。人工智能与大数据之间的关系非常紧密,它们似乎就是天生的一对搭档。

    5. 大数据应用的加速发展

    在大数据核心基础设施的挑战一一得到解决之后,大数据应用必将以飞快的速度构建起来。在企业内部,已经有足够多的工具来帮助跨多个核心职能的企业用户,比如销售和营销的大数据应用通过处理大规模的内外部数据就可以分析出哪些客户会购买、续约或者流失,并且这些分析结果都将是实时得出的。

    这些大数据应用依托在最新的大数据技术基础上开发,客户无须部署底层大数据技术,即可利用大数据,而底层的技术已经是打包的,这是未来的一个趋势。另外,人工智能在应用层也将得到广泛应用,比如在安全领域用来对付黑客。

    然而,随着大数据的深度发展,这个词可能会变得越来越冷,不是因为它过时或者不重要了,而是因为它将成为未来科技的血液,在我们看不到的地方发挥作用。对于技术层面的东西,这或许就是最好的命运归宿。

    《智能主义》一书中,老周分享了在人工智能浪潮下,传统企业、互联网企业如何抓住进一步发展,以及自己如何理解人工智能时代智能硬件产品的游戏规则,如何设计爆款产品。

    《智能主义》一书目前已经在京东、亚马逊、天猫及当当等电商平台正式上线,在公众号后台点击右下方“智能主义”菜单可进行购买。