广电总局数字出版副司长冯宏声:大数据时代,新闻出版业如何跟进

数据,已成为国家基础性战略资源和核心创新要素,对经济运行机制、社会生活方式和国家治理能力有着重要影响,为国家发展提供战略机遇。

大数据,是指以多元形式,自许多来源搜集而来的庞大数据组,往往具有实时性。大数据的特点是,大量(Volume)、高速(Velocity)、多样(Variety)、价值(Value)。大数据的意义在于连接(Connect)与预测(Predict)。

广电总局数字出版副司长冯宏声:大数据时代,新闻出版业如何跟进

文/冯宏声(国家新闻出版广电总局数字出版司副司长)

2015年8月,国务院发布《促进大数据发展行动纲要》(以下简称《纲要》),旨在全面推进我国大数据发展和应用,加快建设数据强国。明确提出从政府大数据、大数据产业、大数据安全保障体系三个方面推进大数据领域的十大工程。《纲要》的出台,赋予了大数据作为建设数据强国、提升政府治理能力、推动经济转型升级的战略地位。

“十二五“期间,国家新闻出版广电总局全力推进新闻出版业数字化转型升级工作,总局一手抓技术与标准的研发、一手抓技术与标准的应用,以技术升级改造及内容资源建设为基础,强化行业在内容资源管理、产品生产、市场传播等方面的能力建设,努力推动新闻出版业实现“生产数字化、资源编码化、运营数据化、服务知识化”。在这一进程中,总局以相关标准为抓手,将数据标准编制、数据采集与分析工具研发、数据交换系统建设、数据供应模式建设等工作纳入重点计划,促进“内容资源数据、资源与产品元数据、产品市场数据、知识资源数据”各类数据的有效沉淀,为全面推进新闻出版业大数据体系建设奠定了基础。

“十三五”期间,总局将深入贯彻落实《纲要》,逐步构建起新闻出版大数据体系,推动国家大数据产业健康快速发展,为建设数据强国提供有力支撑。

从国家层面促进大数据发展

促进大数据发展的目标,是要打造精准治理、多方协作的社会治理新模式,建立运行平稳、安全高效的经济运行新机制,构建以人为本、惠及全民的民生服务新体系,开启大众创业、万众创新的创新驱动新格局,培育高端智能、新兴繁荣的产业发展新生态。推动我国大数据体系的建设与发展,重在大数据的应用。促进大数据发展、推动大数据应用,应当由全社会共同参与实施,参与角色包括以下三个层次。

政府部门是大数据发展与应用的主力军。政府部门应当规范标准,充分利用技术,完善工作制度,有效整合与运用政务数据,开放与共享公共数据,规范与利用行业数据,采集与应用社会数据。政府各部门推动大数据应用的工作目标,一是提高政府监管能力,提高决策针对性、科学性、精准性、有效性和时效性,提高社会治理风险防范能力,提高政府综合治理水平;二是提高政府调控能力,实现对经济运行的准确监测、分析、预测和预警,规范产业发展秩序,发挥市场在资源配置方面的积极作用,提升政府宏观调控水平;三是提高政府服务能力,以数据应用加速行业转型升级,提升对行业的公益性服务水平,实现对民生需求的准确把握,提高对社会的公共服务水平;四是提高政府安全保障能力,以数据安全保障文化安全、保障国家安全。更多大数据知识:www.yangfenzi.com/tag/dashujv

广电总局数字出版副司长冯宏声:大数据时代,新闻出版业如何跟进

行业数据机构是大数据发展与应用的中坚力量。国家大数据战略的实施,急需建立推动大数据应用的各行业数据机构,承担分领域的国家级大数据应用职责。建立各行业大数据管理与应用服务机构,应当把握的要点,一是行业数据机构应当是政府可开放的公共数据与行业数据、社会数据进行交换与聚合的枢纽,是政府部门管理、指导下的中立机构,不与企业形成市场化竞争;二是行业数据机构应当为政府部门开展面向社会的大数据公共服务提供有力支撑,政府部门可以通过行业数据机构、以政府采购方式购买相关数据应用服务;三是行业数据机构应当为市场主体提供市场化大数据应用服务,为引导和鼓励全社会开发大数据应用,激发创新创业活力,推动万众创新、开放创新提供全面支撑。

各领域市场主体是大数据发展与应用的生力军。推动大数据发展与应用的市场主体应当包括多重角色。一是产学研联合建立的大数据相关标准与技术研制机构,为大数据应用提供基础动力;二是各领域作为市场主体的企业,由其建立内部数据管理与应用部门,对自身生产活动中产生的业务数据进行采集、管理与应用,为行业级数据资源的汇聚奠定基础;三是各领域提供数据应用支持的市场化运营机构,为企业提供技术支持、数据存储及灾备支持、市场运营支持,以及提供数据采集、管理、结构化处理、知识化提炼以及数据分析挖掘等数据价值开发应用服务。

新闻出版业在国家大数据战略中的定位

新闻出版业在国家大数据战略中处于相当重要、不可替代的地位。新闻出版业在产生数据、更在生产数据;新闻出版业在应用数据、更在供应数据;新闻出版业需要关注数据安全,更是国家大数据安全的重要保障部门。

新闻出版业是大数据的重要生产与供应部门。新闻出版业是跨领域信息内容资源、特别是知识资源的数据生产与数据服务供应部门。一是生产数据,新闻出版业直接的生产活动成果即数据。新闻出版业的生产活动,从文化视角看,是对思想的表达与表现相关成果进行封装、包装、传播;是对文化的传承与创新,对阶段性文化成果进行沉淀,以此为基础促进文化创新。从信息视角看,是按照一定标准对人类思想活动(主观)与人类所处世界(客观)进行描述、记录与传播。以“是否具象化表达、封装、包装”为界限,按照不同生产阶段进行划分,包括信息内容资源数据、信息内容产品数据。二是供应数据,新闻出版业可为外部产业提供基于不同形态数据产品的多层级服务。新闻出版业通过对各行业信息数据进行采集、加工、提炼、标引、重组、呈现、封装、包装、传播,整合图文声像影不同类型的资源,针对多维度的用户需求,生产各种呈现形态的出版产品即信息内容产品,提供狭义数据服务、信息文献服务、数据库服务、知识服务等不同层级、不同种类的数据服务。其中,知识服务是数据服务模式的高级形态,是对相关数据进行知识化加工形成知识资源数据,以高级信息内容产品(即知识产品)为基础,提供知识化解决方案等知识服务,包括为政府管理、外部行业再生产、科研机构研究、教育机构教学,以及个人用户学习、生活、社交活动提供服务。

新闻出版业是大数据的重要产生与应用部门。新闻出版业与其他行业的共同之处在于,同样会产生大量数据,也需要充分利用来自行业内部与行业外部的各种数据。一是产生数据,新闻出版业在生产活动中会沉淀大量自然产生的数据。其中,元数据,是对新闻出版业自身生产活动成果的描述与记录,包括对信息内容资源、信息内容产品的描述数据;市场数据,包括机构数据、流通数据、交易数据、用户数据等,新闻出版业要在现有基础上,加快推进行业内元数据平台建设,提高元数据采集、汇聚、管理、交换效率,全面掌握行业家底。二是应用数据,新闻出版业与其他行业一样,同样有基于数据汇聚与分析、指导再生产与运营的大数据应用需求。应用数据支撑再生产,新闻出版业要一方面汇聚产业内部数据,一方面从外部产业采集获取数据。重点是对市场数据、特别是用户数据(需求数据与行为数据)的采集。新闻出版业要加快推进行业内数据应用平台建设,通过分析、挖掘相关数据价值,实现有效生产与运营。

新闻出版业是大数据安全的重要保障部门。首先,新闻出版业要高度关注数据安全问题,新闻出版业的核心是以信息内容资源为基础的各种信息内容产品,运营过程也会产生大量数据,还要从外部产业获取大量数据,为保证生产、管理、存储、流通、服务各个环节的顺畅,都需要高度关注数据安全。其次,新闻出版业也是大数据安全的保障部门。新闻出版业既是文化产业的支柱性部门,也是信息产业的重要组成部分,随着互联网的发展,信息内容数据安全已成为信息网络安全的基础,只有实现信息内容数据的可管可控,才能确保国家大数据安全,保障国家文化安全、国家信息网络安全。当前,新闻出版业正在以《国际标准关联标识符(ISLI)》标准为核心、对原有标识符标准进行改造升级,加快构建对信息内容资源及产品进行全面标识与管理的标识符标准体系,并以标准为牵引,研发相关技术工具与系统,建立起元数据管理体系。新闻出版业必将成为切实保障网络安全、保障大数据安全的重要部门之一。

广电总局数字出版副司长冯宏声:大数据时代,新闻出版业如何跟进

新闻出版业促进大数据发展总体思路

促进新闻出版业大数据体系建设与大数据应用,应统一认识,共同探索实现路径。要从顶层设计、政策发布、制度建设、机构建设起步,加强标准研制应用,加速技术研发与系统建设,搭建数据开放、共享、交换、运营平台,积极探索大数据应用模式,提高数据应用价值,推动行业大数据建设,带动新闻出版大数据在行业内外的产业化应用,构建完整的新闻出版业大数据体系;应立足解决行业共性问题,加强资源整合与信息共享,形成政府指导、行业机构组织、产学研联合的工作格局,鼓励、支持企业牵头参与,跨地区协作、跨领域合作,实现“平台整合共建、系统分布部署”,循序渐进地推进大数据建设工作。

准确把握新闻出版业大数据的概念内涵。新闻出版业要逐步统一认识,扫除认知障碍,准确把握大数据的概念内涵外延。一是不能将大数据与大规模数据简单划等号。虽然大数据的概念中包含大量、海量的特征,但这是一种相对的计量方式,大数据不等于简单的大规模数据,大数据强调的是对某一领域相关数据采集结果的覆盖面,强调数据的完整性、全貌性。二是不能将大数据与数值化、数字化数据混为一谈。数据是信息的表达,信息是数据的内涵。数据作为信息的表现形式和载体,可以是符号、文字、数字、语音、图像、视频等。数值化数据,仅仅是数据封装形态的一种,是较为初级的数据形态,其呈现方式多为数字、符号、图表。谈及大数据的概念内涵与外延时,不能将下一层级的数值化数据概念上升到大数据的概念顶层。

认真梳理新闻出版业涉及的数据种类。新闻出版业开展大数据建设所涉及的数据,可以分为行业外数据和行业内数据。一是行业外数据,即外部国民经济行业领域各企业的生产活动数据与生产需求数据、源自公民个体行为的生活活动数据与生活需求数据,还包括相关机构的活动数据与需求数据;二是行业内数据,即新闻出版业内部相关数据,可以再细分为不同层次,包括:信息内容资源数据、信息内容产品数据、元数据(含资源元数据、产品元数据)、市场数据(含机构数据、流通数据、交易数据、用户数据)。行业内数据与行业外数据将相互关联,在市场运营、产业应用中相互影响,为新闻出版行业、其他学科领域和社会公众提供管理服务、行业服务和各类公共服务。

清醒认识新闻出版业存在的数据问题。制约新闻出版业大数据体系建设的问题,一是数据标准不统一,新闻出版业近年来发布了一系列规范数据采集与管理的国家标准和行业标准,覆盖内容资源描述与标识、内容数据存储与管理、产品数据描述与记录、产品流通规则、产品流通数据管理等,但由于缺乏资金投入,贯彻实施标准的技术工具与系统的建设不足,造成这些标准的实际贯彻仍不到位,客观造成实践中的数据标准不统一。二是数据体系不健全,行业内数据缺乏衔接,数据孤岛现象严重,与行业外数据难以有效关联。三是数据流通不顺畅,行业内上下游之间由于缺少健全合理的数据交换共享机制,造成数据流通不畅,行业内与行业外的数据交换模式尚未建立。四是数据应用不充分,行业内数据资产管理意识普遍较低,对数据的价值认识不到位,不想用、不会用、不敢用的现象比较普遍。

稳步推进新闻出版业大数据体系建设。十三五期间,总局将强化新闻出版业大数据的体系化建设。一是做好顶层设计和规划,全面梳理行业数据沉淀现状,结合国务院统一部署,适时发布推动新闻出版业大数据建设的指导政策。二是多角度推进专项数据体系建设,在元数据管理方面,构建内容资源标识管理服务体系,筹建元数据管理机构,建设元数据管理服务平台;在历史数据保护方面,着手论证新中国建国以来传统介质出版物的数字样本库、数字出版物样本库及数字样本管理平台建设项目;在数据流通方面,构建出版发行数据共享体系,搭建国家出版发行数据中心和行业数据服务平台;在数据应用方面,构建国家知识资源服务体系,筹建国家知识服务中心,建设国家级知识服务平台。三是实施行业大数据应用项目,推动数据互通互换、互为支撑,以应用为导向,以公益性项目与产业化项目带动大数据体系建设。

广电总局数字出版副司长冯宏声:大数据时代,新闻出版业如何跟进

出版发行数据共享交换体系建设总体进展

为贯彻落实《纲要》,2016年年初以来,总局按照《国家发展改革委办公厅关于组织实施促进大数据发展重大工程的通知》要求,依托十二五以来总局推动的各项基础性建设工作成果,充分整合行业资源,邀请业内外专家深入论证,结合行业实际需求,初步提出新闻出版大数据应用工程的总体设计思路,开展了一系列具体落实工作。更多:氧分子网www.yangfenzi.com

新闻出版大数据应用工程的总体布局,将分解为电子政务大数据应用、新闻出版产品样本数据应用、新闻出版业元数据应用、出版发行数据共享与应用、知识服务大数据应用等一系列子工程。

在推动“出版发行数据共享与应用工程”建设、加快新闻出版业出版发行数据共享体系建设方面,在财政部门的大力支持下,总局规划发展司、印刷发行司、数字出版司加强横向合作,以CNONIX标准为抓手,加强顶层设计、宏观部署,充分发挥行业内外专家力量,依托新闻出版总署信息中心、全国出版物发行标准化技术委员会、CNONIX标准实验室及专家团队,面向出版发行企业加强指导,在众多出版发行企业的支持与配合下,全行业从大局出发、求同存异、齐心协力,已取得显著成效。

2013年开始的CNONIX标准应用试点项目,已完成出版发行数据的“微循环”实验,在大型出版发行集团内部实现了数据的交换与共享,验证了技术系统的可行性,初步探索了业务模式改造的路径;2014年12月开始的CNONIX标准应用示范项目,已初步完成出版发行数据的“小循环”实验,完成第三方数据共享交换实验平台建设,在20多家出版发行单位之间实现了数据的交换与共享,自2016年春节以来,近6万条书目数据、超过1千万条发行业务数据实现了跨地区、跨企业交换,初步探索了行业级数据共享与交换的机制。

在试点示范工作期间,在发行标委会的推动下,在参与单位的配合下,已完成了一批可落地应用的项目标准和企业标准的研制。此外,CNONIX实验室研发了符合标准的数据采集工具。在技术企业协助下,多数示范单位已配置了企业级的出版发行数据管理系统。2016年6月,在总局部署与指导下,新闻出版总署信息中心已组建专业化与专职化团队,启动行业级第三方数据共享交换平台建设,全面推进行业级公益性数据共享交换服务机构的建设。

下一步,总局的几个业务司将密切合作,继续加强对行业的指导与扶持,自下而上地、由企业为主体地提出如何建立行业规则的建议,并根据企业的需求,出台相应政策,规范行业秩序,更好地为行业发展做好政府的服务工作。

(本文为冯宏声在2016年上海书展“CNONIX国家标准应用研讨会”上的发言)

氧分子网(www.yangfenzi.com)是关注互联网生态圈的科技新媒体

·氧分子网http://www.yangfenzi.com)延伸阅读:

➤ 这些年被互联网“倒逼”的出版业

➤ 出版业 未来的破坏性创新怎么玩?

➤ 《一网打尽》书摘:亚马逊打击出版业

➤ 2014年自媒体突围新方向:自出版

➤ 出版社试水电子化,中信书写“中国故事”

➤ 亚马逊给出版商下套:网上售书收入全部给作者

➤ 国家新闻出版广电总局李建臣:读书让人有诗和梦想的冲动

➤ 面对传统新闻出版业的敌意,想要拯救新闻的Google该怎么做?

➤ 愿人民出版社读书会给你的美好回忆不辜负这日盛装出席的你…

分享给您的好友:

您可能还喜欢…

  1. 针对大数据时代,相关的人才无非是数据定制、数据采集、数据挖掘、数据分析、可视化、数据决策这些人才,和其他涉及大数据企业没有区别。这是因为,大数据这个词,本身就是凌驾于行业之上的。钻研媒体内容我觉得一直都是传统行业可以并且能做好的事情,大数据的应用我觉得可以偏向于将精品内容在合适的时间发给合适的人群,这两个合适就是大数据应用的目标过去的出版行业主要是纸、后来有了一部分磁带、影像
    未来呢?
    出版业肯定也会越来越数字化哦!既然想到了大数据,有没有考虑出出版社往小众方向走呢?就是定制化、个性化的出版,这在未来或许是一种机遇哦!美国现在最火的职业之一是data scientist. 需要学习计算机专业编程,算法和machine learning.

    Mckinsey 预测这个专业在美国起码会有十几年的生命力,国内的话可能更久。

    最本质的原因是相关的人工智能使得大量重复性的工作被软件取代。而现在被取代的工作已经包括大量白领的工作,包括marketing, sales, etc. 可以参看MIT教授写的一本书, race against the machine.

    这个趋势在美国很明显,在国内可能刚开始。

    假如你是鸡头,以前你要对顾客说的就是,我的妞,活好,脾气好,服务好,胸大,在大数据时代,你可以展示给顾客,你的妞的三围、兴趣、才艺表演、顾客点评、宣传小电影、反正原来需要专业团队打造的数据,现在借助现代化工具,都可以实现,是不是这个意思?《与机器竞赛》大數據不是取代 MKT 和 SALES,而是讓企業做到 mass customization,或者說就是能夠做到極致的定製化的服務與推廣信息。這樣可以讓 MKT 和 SALES 更有效。
    所憧憬的金融业,还是数据处理的相关行业,数学都是基础中的基础。在大学,你会接触微积分,线性代数这些基础课程。 如果你希望成为数据处理方面的专家,统计的知识必不可少, 可以修概率论和数理统计作为入门。 再者,在上大学之前我也抱着本科学金融的想法,或者企业管理,因为那样的职位看似在金字塔的顶端。 但实际上中国高校金融专业的学生数不胜数,管理类关于亦是,而教学质量并不高。 复旦的学历决定了你的起点会比其他毕业生高,但不代表你能走的更远。学好数学,你将会有足够的资本深造金融,或者做其他选择,数据科学家,软件工程师…

  2. 很多职业没有明确的界限,比如软件工程师同样要懂高数,数学科学家要会编程。 如果你相信大数据会是未来一个有前途的行业,那么掌握编程语言也是必要的。 非CS类学生可能会对编程重视不够, 即使是我身边很多学计算机的学生,让他们编一个排序代码也不轻松。 多练习多实践,掌握这些语言不是加分项,而是必需项。

    中时代的重心应该是放在高考上,阅读课外书的时间对学生是一种奢侈。 不管你将来从事什么行业,光靠考试高分是不行的,社交能力,生活态度,个人视野都是你的竞争力。 如果你在大学中有闲暇时光(实际上再忙也能抽出时间来),那么请多读书。 你的生活会因为读书而跟身边的人不同,相信我和(大)数据相关的行业很多,遍布生活的各个角落。你读的那本书里有很多具体的案例。 九十年代,谷歌的搜索引擎引爆了数据,你可以发现数据对谷歌是一笔多么重要的财富, 谷歌翻译,谷歌数字图书馆,自动驾驶技术都是基于海量数据的。 现在,社交媒体的发达带来更巨大的数据大山。 不仅仅是数据,也是机会。
    哲学课本上是不是有德国一个实践共产主义的案例,话说连农庄种多少棵树,种几行几列都计划好的模式,是不可能成功的。成功,有太多的意外。必然有太多的意外,尤其是失败,伴随其间,不时出现。
    人生,不是靠规划就能取得先机的。有个大方向就差不多。

    所以,不要追热潮,不要追求所谓的别人眼里的成功。刘德华张学友都公开说过,自己才刚刚起步。我相信这是他们的真心话。但凡取得一定成就的人,都是靠不断积累。

    你敬佩谁?毛泽东还是Jobs,比尔盖茨,你去看看他们的传记,没人高二开始规划一切。你只要决定自己是干互联网,还是金融,决定了这个就很好了。然后就是就读知名学府。到了新的台阶,你会明白不同。

    登上东山,先晓鲁,再登泰山,晓天下。
    一个一个山头来。大数据将全面改变我们的生活,这已经成为学界、业界和政府的共识,那么如何进行相应的职业规划,就开始成为一个重要的问题。

    任何新技术刚出现的时候,人们都是难以理解的。而这些技术所引发的经济和社会变革,往往连技术的发明者都难以预料。所以每一次的时代变革,都只有少数人能够进行正确响应,享受变革带来的时代红利。面对互联网革命,多数人都只能接受“看不见、看不起、看不懂、跟不上”的结果。俞敏洪也感慨“ 一夜之间,你有可能就被别人超越、占领、推翻了。”

  3. 面对企业的升级,白领们更是需要练就三大能力,实现白领人才2.0的升级。

    第一是管理信息的能力 。白领必须学会在ERP(Enterprise Resource Planning)系统、CRM(Customer Relationship Management)系统中处理经营数据,从社交媒体、专业书籍中发现关键信息,并用印象笔记等软件管理信息。白领必须实现个人的信息化,才能在已经信息化的企业中生存。

    第二是数据分析能力。基于企业信息系统提供的经营数据, 借助Excel、SPSS、R等软件进行数据分析 ,找到改善经营的出发点。白领必须练就数据分析的能力,才能适应企业决策的数据化。

    第三是理解精细化管理 。海量数据的时代,人们很容易在决策时陷入信息过载。缺少精细化管理的系统思想,和企业管理的整体认识,员工很可能在海量数据中陷入盲人摸象。 精细化的理论和实践仍在不断发展,国内外的多数企业都才刚刚起步。如果,技术+管理=价值。那么,精细化管理+大数据技术=大价值。

    大数据时代的企业竞争将空前激烈,市场压力将全面传导至个人层面,迎接我们的,将是换人就像换手机,裁员就像删软件的年代。不断实现个人升级,成为2.0版本的白领人才,和企业信息系统和精细化管理保持高度兼容,是大数据时代职业规划的必然出路。

    这三种能力有着很高的门槛,高校更是缺少相应的培养,根本办法还是阅读、自学、请教、实践,实现自我驱动的系统升级。没有实现个人信息化的员工,将很难和信息化的企业实现兼容。在找工作时就会面临难度大、起点低的困境,往往陷入边缘性的繁琐工作,进入没有积累和没有出路的恶性循环。培养匮乏和学习门槛,也带来了信息化人才的高度稀缺性。但实现了自我升级的毕业生,则抓住了企业升级时的痛点,有着巨大的职业优势。

    转型成为数据工作者:
    大数据时代的到来,为多数白领工作者带来了巨大的竞争压力与替代风险。但是大数据时代,也让一种人才变得严重供不应求。那就是专业化的数据工作者,包括数据科学家、数据工程师和数据分析师。Gartner咨询公司2014年发布报告,估计全球的数据科学家人才缺口已达到440万。由于数据价值的继续增加,数据成本的持续下降,人才的供应则持续紧缺。数据分析师的人才缺口会持续扩大,形成历史上最大规模的职业人才缺口。此前最大的岗位缺口比例,是达到30%的软件工程师岗位,而数据科学家和数据分析师的缺口,目前已经达到了65%。数据存量和数据技术早已进入指数增长,人才培养的线性增长已被大幅甩开,数据人才的缺口将会不断扩大。

  4. 数据工作是我们这个时代的最大职业机会,对于这个机会的把握,决定了我们选择成为大数据技术的队友,还是对手。身处大数据时代,所有的白领都必须实现个人的信息化升级,成为半个数据分析师。对于白领而言,数据分析就像英语技能,是这个时代的基本沟通工具。在这场人类构建智能企业、智能社会,乃至智慧地球的数据革命中,我们面临着人类历史上的最大人才缺口,每一个企业都在寻觅优秀的数据工作者。

    数据工作不仅是有史以来缺口最大的岗位,也有着很强的职业吸引力。大数据时代以前,数据工作就在美国被认为是最佳职业选择,精算师和统计学家长期占据着最佳职业排名的前三位。在大数据时代,数据工作者有着四大职业优势。

    第一,他们有着很高的不可替代性、稀缺性,以及相应的高收入。在大数据时代,越来越少的岗位是不能被机器所替代的,不可替代性越来越重要。
    第二,他们能实现深厚的个人积累。数据工作的过程,也是自身知识积累和技术积累的过程。数学、统计的相关知识积累很难被更替,而且数据分析往往要和决策层合作,对决策和视野也是难得的历练。
    第三,他们能获得更强的工作成就感。大数据时代的数据更多,技术更强,数据工作者的潜能也变得更大。
    第四,他们有着很强的职业自由度。任何行业和国家、都在寻找数据工作者。他们可以选择自己真正感兴趣的工作内容、地点、环境和时间,这都是决定职业幸福感的重要因素。
    大数据时代中,所有企业都在努力实现信息升级和智能升级。我们每一个青年,也应该认真思考自身的转型升级路径,实现和这个时代的对接兼容。只有实现了系统的升级,才能够拿到前进的车票,享受只属于这个时代的动人风景与变革红利。

  5. 2011年4月20日,新闻出版总署公布了《新闻出版业“十二五”时期发展规划》,《新闻出版业“十二五”时期发展规划》明确提出,到“十二五”期末,使国民综合阅读率达到80%,实现人均年拥有图书5.80册、期刊3.10册,每千人拥有日报达到100份,人均书报刊用纸量达到240印张,千人拥有出版物发行网点数0.13个,版权登记数量70万件。

    在经济总量方面,根据规划,“十二五”时期新闻出版产业增长速度达到19.20%,到“十二五”期末实现全行业总产出2.94万亿元,实现增加值8440亿元;在产品规模方面,到“十二五”期末,年图书出版总印数达到79.20亿册(张),报纸出版总印数达到552.30亿份,期刊出版总印数达到42.20亿册。出版物实物出口数量超过1150万册(份、盒、张),版权输出品种数达到7000种。此外,规划还明确提出,“十二五”时期,科技投入在行业增加值中所占比重逐年增加,单位能源消耗逐年降低,绿色印刷企业在全部印刷企业数量中所占比重超过30%。

    前瞻产业研究院发布的《中国图书出版行业市场前瞻与投资战略规划分析报告》显示,2009-2013年,我国图书出版行业出版社规模保持平稳发展的趋势,出版社总数基本维持在580家左右,反映行业发展较为稳定。截至2013年年底,全国共有出版社582家(包括副牌社33家),其中中央级出版社221家(包括副牌社13家),地方出版社361家(包括副牌社20家)。

    2009-2013年,我国图书出版行业销售收入不断增加,增长速度总体趋势下降。2011年,我国图书出版销售收入为664.4亿元,同比增长23.52%,为近年来最大值;2012年,我国图书出版行业销售收入为723.5亿元,同比增长8.90%;2013年,我国图书出版行业利润总额为770.8亿元,同比增长6.54%。

    截至2013年年底,全国共有出版社582家(包括副牌社33家),其中中央级出版社221家(包括副牌社13家),地方出版社361家(包括副牌社20家)。

    集团化使得产业竞争格局发生了重大变化。一些出版业相对发达的省份,以及那些集团建设和体制改革取得重大突破的省份,由于出版集团对资源的高度集中、整合和高效运作,极大地推进了出版业的发展,出版资源也不断地向这些区域积聚,加速了出版产业发展的不均衡。除北京、上海两大出版中心外,一些区域已经形成了新的出版中心,如江苏、湖南、广东等地,已经成为重要的区域性出版中心。

    近年来,互联网和智能终端的快速发展,传统图书出版业受到了前所未有的挑战,电子书凭借着自身的优势不断蚕食传统出版业的市场,前瞻分析认为,未来图书出版行业的发展将呈现两种趋势:一是电子图书与传统图书并融;二是图书成为奢侈品是趋势。

    电子图书与传统图书并融
    电子图书是通过电子装置阅读印刷发行的图书,电子装置包括电脑、手机和专用终端。其中,电脑下载阅读电子书固然有屏幕大的优势,但毕竟人要坐在电脑旁,要专门安排读书时间喷墨印刷,相对不太方便,因而电脑电子书市场发展不快;因为显示屏太小,手机并非最好的电子书终端,但是由于可随时随地上网,可随时随地阅读电子书,因而成为最受欢迎电子书阅读工具,特别是已经普及的第三代手机,可大量下载图像,更是加快了手机电子书流行趋势。

    电子图书作为新兴的一种产品存在一定的优势,但在近几年内电子图书还不能真正的代替传统图书,成为纸质图书的完全替代品。电子书和传统印刷书籍各自的优缺点,决定了不可能出现两者之间独霸市场的现象。未来传统印刷市场的缩水之势不可避免。但传统的印刷方式并不会消失,传统图书与电子图书并融之势将成为未来图书市场发展主色调。

    图书成为奢侈品是趋势
    在近年来的图书市场上,精装版、限量版已经渐渐成为一种潮流,稍有影响力的作品出版时,一般都要有精装和平装两个版本,而少儿图书更是精装成风。同时,随着电子阅读时代的来临,纸质书的数量将在未来几年内大幅减少。将来的纸质读物可能只剩下少儿图书、艺术类图书和一些经典作品。图书将成为具有很强收藏价值的艺术品,越来越注重装帧设计和工艺质量,在定价上也将会越来越高。如此看来,图书成为奢侈品将成为图书出版市场未来的另一发展趋势。

  6. 图书行业是一个向荣的行业(当然我是以读者的身份感受的),尤其是独立书店,在探索和发展中,到了一个转折点。我记得近几年里还专门有一本关于国内独立书店的书,独立书店 你好。看过一些采访和分析,我觉得像独立书店,独立杂志这些最大的应该就是资金问题。经营总是个难题。大数据已经无处不在了,可太多数人其实并不理解大数据到底是什么、能做什么用。甚至很多的公司都守着一堆大数据,却不知如何应用。

    现在人们有了把人类基因档案序列化的能力,大数据将协助医生和科学家去预测病人对于某些疾病的易感染性和其它不利的条件,减少治疗过程的时间和花费,并实施更精准的治疗方案。利用大数据技术进行舆情监测,追踪公众关注的问题,能极大的提升社会科学研究能力。每个人在互联网上交易或行为,其过程(包括关注的页面、发表的图文、看过的视频等)全部是都是可以记录的。企业可以充分利用这些数据进行精准营销。大数据通过数据分析,帮助企业客户有效判断用户的信息需求和消费需求,进行精准产品开发,做到最大化的资源整合利用。大数据可以按卡口名称、车道名称、车辆类型、车牌号码、车身颜色、车牌颜色、车速范围、车长范围、号牌段范围、时间范围等多项进行分析,从而为制定交通方案提供科学依据。掌握移动应用核心数据的企业,将这些数据加以梳理分析,对自身运营及众多品牌企业而言是非常宝贵的资源,对战略决策将形成重要的影响。

    大数据将以科学化的信用评估模型,对客户建立一套全方位的信用评估体系,用数据说话,让数据来决定客户的优质程度越来越普及化的网购 支付宝 等,学习 工作 生活都因为网络信息的广泛传播和应用,而变得便利很多。同时也有一些坏处,大数据时代下,我们的个人信息很容易就被曝光,从而导致一些重要私人信息被不法分子盗取。大量的数据和信息考验的是企业、政府的数据分析能力。可以预见的是在大数据时代,企业提供的服务和产品将会更加符合用户需求,而政府的决策也将会更加的合理。大数据时代就是所有人以最小代价获得最大利益的时代。

    交通方面大数据可以帮助人们搭配最佳出行方案。上海地铁通和滴滴打车等app就是很好的例子。腾讯副总裁江阳说:“未来滴滴打车还能够为用户设计‘智能出行方案’,当你输入出发地和目的地,系统便会给你方案:是打车、拼车、公交还是地铁,哪种搭配组合更经济、方便。”这将使人们的出行更加方便。

    无论传统媒体还是网络门户,都受到了来自移动互联网的冲击和影响,大数据时代的来临又让我们应该如何去梳理数字内容的价值链?如何在碎片化生存的时代保留话语权,如何与用户建立对等、开放的新社群关系,而不是广播式的布道?

    数字阅读领域目前的现状,其根本原因是移动互联网重构了内容形态(碎片化生存)、重构了内容消费时间(黄金时间、垃圾时间再定义)、重构了社会的组织形态(社交化),信息在关系链流动中又重构了信息本身(内容再生产),而我们的内容生产者和内容传播平台还远远没有根据现实满足用户需求、服务用户体验。

    大数据时代的来临,最明显的特征无疑是内容生产数量的几何级倍增。

  7. 【全球每秒钟发送 2.9 百万封电子邮件,一分钟读一篇的话,足够一个人昼夜不息的读5.5 年…

    每天会有 2.88 万个小时的视频上传到Youtube,足够一个人昼夜不息的观看3.3 年…

    推特上每天发布 5 千万条消息,假设10 秒钟浏览一条信息,这些消息足够一个人昼夜不息的浏览16 年…

    每天亚马逊上将产生 6.3 百万笔订单…

    每个月网民在Facebook 上要花费7 千亿分钟,被移动互联网使用者发送和接收的数据高达1.3EB…

    Google 上每天需要处理24PB 的数据…】

    以前通常我们会在电脑上同时打开多个窗口,处理多件事情。听会儿歌,看会儿视频,和N个人聊天,遇到好奇的东西用搜索引擎查询一下,时不时刷新邮箱、微博或者 SNS网站查看新消息,个别勤奋的朋友可能同时还在更新空间、博客 。现在我们多了一个带在手边的设备,手机或者平板。我们不仅要刷刷微博,还要看看微信,或者玩几把游戏,关注谁给你发来了信息,或者那个应用又弹出来新的资讯。

    在媒介的发展过程中我们已经验证了这种进化的过程,很多电视新闻节目、传统报刊为了增加受众粘度而大量减少硬新闻的比例,将名人趣事、日常生活百态、百姓生活密切相关的信息内容、带刺激性的犯罪新闻和暴力新闻、灾害事件、体育新闻、文化新闻、娱乐新闻等软性内容作为新闻的重点。

    这既是一个最好的时代,我们的信息和媒介无所不在,这也是一个糟糕的时代,我们被信息包围,每个人成为完美的多任务处理机器人,信息过载,有价值的内容和冗余的信息裹挟而来,我们逐渐被碎片化的生活所笼罩。摆在数字内容平台和产品面前的,要么娱乐至死,制造热点,炒作热点,要么变得更碎片化,在人们短暂的注意力停留中创新内容和展现形式。

    大数据时代,基于数字内容所拓展的平台和产品同纸质媒体、传统门户一样,要摆脱单一的流量经营和复本经济模式,同时也要有一种新的运营机制来防范海量数据带来的噪音、提升个性化内容的比例,增强用户获取信息的便利性,更要将基于内容所产生的用户行为、用户数据、用户特征等转化为数据资产(用户群体、性别、年龄、教育程度、收入区间、生活范围、阅读偏好、品牌关注度、情绪等等),从而创造一种新的产品范式。

    Zite是移动终端上一款免费的个性化杂志订阅应用。该应用通过采集用户的阅读行为,判断用户的兴趣,从而能够把一些用户感兴趣的新闻、资讯、图片、音乐、视频聚合起来呈现。去年8月份Zite被CNN以2000万美元的价格收购。

    ZAKER作为国内最流行的社会化阅读平台,除了提供高效、互动、有良好体验的阅读服务以外,还利用海量数据和特定算法创新广告模式,它可以根据人们的居住地点、浏览资讯的偏好,挖掘出哪些品牌的产品更受到哪一类群体喜欢,从而将品牌广告的投放范围、时间和差异化的资讯结合起来。比如,喜欢第一财经周刊+GQ男士网+世界国家地理的用户,可能会更偏向于追求高质量的生活方式、爱好旅游、关注奔驰、奥迪等高级汽车的新车型。目前ZAKER拥有2800万用户,分布于iOS、Android、Windows系统,主流用户群从20-45岁,属于或将步入社会中坚群体,每天用户活跃度达500万,他们每天阅读超过10万篇文章,PV量超过1亿。

    传统媒体原来通过产品价格和品牌定位来进行用户价值的单项过滤,而大数据时代的新兴公司则可以通过用户本身的社群关系、兴趣偏好、情绪脉动等数据挖掘能力来过滤用户价值,并通过用户行为数据来判断目标用户是否精准、内容商应该生产什么内容、洞悉用户的消费趋势,甚至让用户来为自己的商业利益代言等等。

    谷歌作为以分析用户数据来盈利的公司,最近又有大动作,它宣布将于2013年11月11日以后在整个互联网的广告中显示用户的名字、照片、打分以及评论,为市场推广者的产品作背书。Facebook此前已经在经营类似的背书广告,如果您在某乐队的 Google Play 页面上对其专辑给了4星评分,那么您的朋友就有可能看到;当您为自己喜爱的当地面包店+1时,该面包店在 Google 上投放的广告中会将其反映出来。

    借助大数据相关的技术,不同经营方向的互联网企业也可以实现跨界整合,充分拓展数字内容消费的积极性,扩大企业的经营深度。

    LinkedIn作为全球最大的职业社交网站,一直致力于提供“高效”、“安全”并且“有商务价值”的社交服务。前几个月它以9000万美元购买新闻阅读应用Pulse,社交和阅读的整合成为了一个移动互联世界的新注脚,为什么LinkedIn会钟情于阅读呢?

    毫无疑问,职业社交网站已经从人与人之间的“工具联系”进化到“资源和利益交换”。 作为较早采用大数据架构的互联网公司,个性化内容的搜索、挖掘、推送成为LinkedIn的下一步大动作,今年3月份LinkedIn更新后的搜索功能不仅可以帮助用户寻找社交关系,同时可以帮助用户提高寻找内容的体验。

    优质并且丰富的内容源是LinkedIn关注的重点,与Pulse合作的内容提供商750家,每天有超过2000万的用户在Pulse上阅读超过1000万条资讯,为LinkedIn用户提供更多有价值的内容,更重要的是LinkedIn的用户还参与规模化的信息传播和内容再生产,这将赋予社交平台流量优势、用户粘性和新营收渠道。

    数字内容不仅仅是媒介信息的数字化,一张图片、一篇文章、一首歌、一部电影都可能是人们情绪、情感、思想的表达,当智能终端和移动互联网完成个体与虚拟世界的实时连接,信息流便不仅仅承载着信息本身,还有人们的社交关系链、情绪化数据,基于大数据技术所形成的数据挖掘、语义分析等技术将促进数字内容消费进一步大发展,促进数字内容媒介与新兴科技的跨界融合。

    云计算、移动互联网和可穿戴计算的结合,就让我们迎来一个可感知、反馈、分析和预测的量化自我的“大数据时代的来临”。

    谷歌眼镜版《纽约时报》应用可以按照固定的时间间隔将新闻和头条消息推送至眼镜显示屏,用户只需快速倾斜头部,就可以在新闻图片和全文中实现浏览和切换。一旦安装成功,谷歌眼镜就会时不时出现在用户耳边朗读新闻头条。该应用还可以朗读新闻的简要介绍。总的来说,这款应用简单易用,足以帮助用户每天获得足够的新闻。其他公司也已经计划推出适用于谷歌眼镜的应用,例如基于大数据进行的知识管理产品Evernote和Twitter等。

    《纽约时报》借助可穿戴设备不仅仅是眼镜,还有Leap Motion体感控制器,通过手势查看新闻:通过这款工具,读者可以移动双手浏览新闻,通过一个圆形的移动,用户可以滚动文章,摇摇手,就可以回到主菜单。另外,应用中的标题、图片、新闻摘要等内容,将以卡片的方式呈现。

    从数字内容个性化的聚合、筛选、挖掘乃至于推送;从用户参与内容生产、传播到用户评价背书成为一种新的盈利工具;从内容的跨界整合到精细化内容与用户的无缝对接;从传统的听说读写到借助可穿戴设备让阅读模式实现自我量化的反馈经济模式形成,这一切都围绕着大数据的思维和技术手段的运用,数字内容新的经营范式也再不断被改写和再造,如果我们深入理解大数据,那么我们就能在内容消费创新中找到一套独特而有潜力的价值发现和整合的路径!

  8. ods层一般是保存历史数据,拉链数据,表结构基本与源系统一致?
    在大数据时代,建设新的ODS有没有新的技术与方法??包括数据库选型,硬件选型实施方法论等?于数据量特别的企业,现在都开始使用Hadoop类开源产品建设数据仓库;

    2.数据结构已经不会保持一致,而是按照数据分析的要求存储;

    3.拉数据的应用程序现在讲究通用,因为需要从各种不同的数据来源 ,最后汇总到一个地方,我们热璞科技的Datapost产品就是如此。

    3.数据量要是超过10个T,且增长量保持40%/年以上,建议考虑Hadoop家族产品,硬件采用X86服务器+本地盘(2T或3T STATA盘)。仅凭“数据大”是没有意义的,真正有意思的是数据变得在线了,这恰恰是互联网的特点。在线,让数据搜集变得非常容易,人们对网上数据的分析可以影响甚至决定人们的消费、娱乐、出行、社交等等,从而影响整个社会。我们需要更精确的信息数据去指导我们每天的工作和生活;而精确信息的来源基于海量数据分析。众多互联网络公司开始注重并启动了“数据经营”的业务,而且有的已经成为了企业盈利的重要模式。

    之前做过上海IPTV和SITV的数据。现在电信拿不到电视直播的统计,但是点播数据也很可观了,样本相当大,可以从一个侧面反映收视率如今是数字时代,它给我们带来了很大的便利,但是这个便利是要付出代价的,其中之一就是个人隐私。不要以为很多软件或服务是真正免费的,其实你已经付出了隐私的代价。
    目前隐私的暴露,不是因为某个软件或某项服务,而是全方位的窥探,你躲得过去吗?
    要想彻底保护个人隐私,必须做到以下但不局限于以下几点:
    1.彻底停止接触一切数字设备,包括但不限于计算机、手机、PDA等等。
    2.彻底停止一切登记个人信息的服务,比如银行、交易等(银行也交易客户资料)。

    当你做到以上几点之后,恭喜你,你会发现自己成了一个“与世隔绝”的原始人。
    在一个大家都在“出卖”自己隐私的社会,你要想保护个人隐私,一个字,难!
    有人会想到立法,关于法律在隐私方面的保护我就不想说了。、定期清除自己的cookie,有的爬虫直接调走你的cookie,里面基本上什么都有。
    不要泄露自己的个人信息,尤其是在很多网站注册的时候,都尽量不要填写真实的个人信息。
    社交网站要注意尽量不发布个人有关的信息,社交网站上的信息的公开,随便一个爬虫都可以爬了。

    业务部门没有清晰的大数据需求导致数据资产逐渐流失;企业内部数据孤岛严重,导致数据价值不能充分挖掘;数据可用性低,数据质量差,导致数据无法利用;数据相关管理技术和架构落后,导致不具备大数据处理能力;数据安全能力和防范意识差,导致数据泄露;大数据人才缺乏导致大数据工作难以开展;大数据越开放越有价值,但缺乏大数据相关的政策法规,导致数据开放和隐私之间难以平衡,也难以更好的开放。但是像可乐贷这样的互联网金融平台,走在行业的前沿,紧跟大数据步伐,才是真正的好平台。科技的变革我们抵挡不了,只能去适应变革。
    大数据会对生活的各个方面都产生颠覆性的改变,只有去适应并享受大数据带来的便利性。