首届大数据时代创新与媒体变革研讨会召开 姜海清致开幕辞

    [主持人]各位领导、各位嘉宾,2015·首届大数据时代创新与媒介变革"研讨会全部结束,数据引领潮流,科技改变生活,期待大数据与每个行业更深度的融合,期待这碰撞能激荡出更加振奋人心的时代回响!谢谢大家! [2015-03-27 17:42]

    [伍刚]今天有十多家高校研究机构、包括今天我们的中央的主管机构都来了,搭建的是一个观、产、学、研、资,政府、产业、学术、研究机构、还有资本层面,方方面面的人士共同打造一个适合我们中国国情、适合我们中国未来发展的一个大数据的路线图,尤其是我们的媒介如何在大数据的洪流中不被淹没,依然保持像土地社曾经在100多年前说的,我们的记者就是在这个时代航船中凌霄破浪的、舰首的瞭望者。在工业时代、农业时代,他能够看出前面的冰川风暴,那么在大数据时代,我们的新闻工作者、我们的媒介工作者,今天正如我们高伟博士组织的青年媒体人我们应该也在这个信息时代的暴风骤雨中依然看到我们时代前进的航标,看到我们的定盘心,看到我们彼岸,我们不被泰坦尼克号的冰川冲垮、坍塌,我们没有恐惧,我们的字典里面没有弱,我们永远自信、我们没有对我们这个国家充满信心,今天恰逢是博鳌亚洲论坛在海南博鳌召开,我们今天的这个大会的全程在同步直播博鳌论坛的同时,大会所有的嘉宾都在央广网的首届大数据时代创新与媒介变革的研讨会的官方网站上时实发布,我们今天会上还同时发布了我们国家社科基金网络文化建设阶段化的成果,全球网络前沿报告,我们期待这次会议完了之后,我们会把各位专家精采的观点、视频、认真的整理,在会后准备出版一本全球大数据与传播报告,另外还预告一下我们准备与河北大学已经达成联盟,还有中国社科院世界传媒中心也期待我们签约的这十多家院校我们搭建一个开放性的平台,想在今年的下半年习总书记提出的818媒介融合的深化体制改革的一周年之际准备召开一个全球大数据和传播峰会,河北大学传播学院今天早晨白院长已经做了致辞,他们已经开始启动这个程序,欢迎各位继续鼎立支持。谢谢!今天的会到此结束,谢谢! [2015-03-27 17:40]

    [伍刚]我想我们作为世界上第一大网络用户也实际上是世界第一大大数据的用户,如何把我们的大数据真正的造福我们这个古老的中国,让我们这个社会更加透明、更加幸福、更加美好、更加祥和。就像我们当年发明的铁锹、锄头、蒸汽机、电动机、汽车、航天飞机一样,大数据可能会像阿波罗工程一样只一旦启动就会成为我们中华民族创新的新引擎、新动力。正如国务院党中央刚刚通过的创新驱动发展战略,会把我们这一个大数据的国家战略、网络文化强国的战略、网络文化软实力提升的战略落到实处,落到细处,落到我们每一位网络用户、大数据用户的心坎上,落实在我们的行动上。 [2015-03-27 17:39]

    [伍刚]实际上我在过去的一年里在哈佛大学做了一年的中美互联网创新的比较的研究,曾经对话过谷歌的董事长,也问过他谷歌的大数据是否会与个人的隐私相冲突?还有美国政府的首席科技馆奥巴马的首席科技官大数据会带来一个国家5%的GDP的增长,还有我曾经到硅谷、谷歌的总部、Facebook的总部,苹果的总部会探索世界的巨头他们为什么带动这个国家成为世界的强国,我想我们中华民族、我们的中国普通的老百姓、我们中国的网民一点不比世界任何一个国家的人民笨、差、落后。 [2015-03-27 17:37]

    [伍刚]所以我讲今天我们在座的一些人是我们最后把我们这道命题完成最后的士兵突击,完成最后的数字化信息高地的抢占,完成最后的王教授所说的哀叹者。各个数据的全部信息化的制高点的定标、定位、定航。所以说我想今天很感慨,我们在座的这么多,也非常感谢我们央广网产经中心的李春梅(音)为代表的整个会务组的团队,也特别感谢博士生导师陶丹教授不断的督促、催促、督办,因为我们是在业界想做个体研究是没有时间来做的,我们也是不知天高地厚拿了国家社科基金,但是为了不让人笑话,我们做的事情是靠谱的,是有干货的,所以说我们今天请来了很多很多都是业界的大咖,都是有干货的、靠谱的人让大家齐聚一堂、共商我们这个社会未来的能见度、未来如何走向一个更加透明、开放、创新的虚拟时间、虚拟空间、虚拟社会与有血有肉、五光十色的、鸟语花香的社会的融合和渗透,真正的符合我们这个社会。 [2015-03-27 17:34]

    [伍刚]正如去您世界互联网大会我们的央广网的评论员宁静在开幕致词写的评论一样,让中国的传统文化拥抱世界互联网,更好的造福人类,我们虽然说通过一个80后的小女孩说出的话,虽然有点大,但是表明一个80后的小女生她的觉醒,她对这个世界的领域和感悟,所以说我想在这里面,我要真诚的感谢各位从上午一直到下午真诚的聆听。 [2015-03-27 17:36]

    [伍刚]所以我讲今天我们在座的一些人是我们最后把我们这道命题完成最后的士兵突击,完成最后的数字化信息高地的抢占,完成最后的王教授所说的哀叹者。各个数据的全部信息化的制高点的定标、定位、定航。所以说我想今天很感慨,我们在座的这么多,也非常感谢我们央广网产经中心的李春梅(音)为代表的整个会务组的团队,也特别感谢博士生导师陶丹教授不断的督促、催促、督办,因为我们是在业界想做个体研究是没有时间来做的,我们也是不知天高地厚拿了国家社科基金,但是为了不让人笑话,我们做的事情是靠谱的,是有干货的,所以说我们今天请来了很多很多都是业界的大咖,都是有干货的、靠谱的人让大家齐聚一堂、共商我们这个社会未来的能见度、未来如何走向一个更加透明、开放、创新的虚拟时间、虚拟空间、虚拟社会与有血有肉、五光十色的、鸟语花香的社会的融合和渗透,真正的符合我们这个社会。 [2015-03-27 17:34]

    [伍刚]我想,今年两会前夕我们的习总书记提出了在去年12月份提出的四个全面,这里就是说我们要在两个百年这个时期全面建成小康社会,要全面深化从农业社会、工业社会面向信息社会深刻的改革的还要面向从农业社会、工业社会、信息社会新的法治社会、法治市场,融进一个全球化的一带一路全新的新中国,信息化的强国,网络化的强国,在这里面我们同时还要做好一个八千多人的世界上最大的人力资源公司,中国共产党支撑的现代化的治理体系从严治党,这四个全面像我们的动车组一样四轮驱动,像我们的一个全新的追求社会共识的最大四边不等角的最大公约数的定苗、定盘、启航。 [2015-03-27 17:31]

    [伍刚]坦率的说大家都知道中央人民广播电台是一个有着75年历史的在当年延安窑洞的西安弥漫着诞生着中国最古老的媒介,他在拥抱了半殖民地的硝烟,拥抱了建设中国社会主义初级阶段工业化文明脱胎于三千多年的农业化文明,又在这个信息时代三七叠加的矛盾凸显期的时候,我们是谁?我们从哪里来,我们到哪里去。我们这个国家社科基金重大项目网络文化建设研究关于建设中国特色社会主义网络文化强国的对策建设研究,今天在这里应该说还仅仅是刚刚破题。 [2015-03-27 17:30]

    [伍刚]很感慨、很激动,我想坚持到最后的人都是带着一个巨大的问号,大数据时代给我们带来什么,大数据时代将引领我们走向何方?我们从那里来,到哪里去,我们现在都已经换上了互联网+的标签,我们每一个人都被数字化了,都被一个新的工具、新的武器、新的铠甲、新的ID、新的标识、新的符号、新的表达的手段、新的表达的内容全按我们经历了三千年的苦难、坎坷、不屈、崛起、屹立在东方的一个大国,我们要在这个信息时代中依然要继续引领做一个东方的文明大国,在这个世界舞台上面的它应有的使命,职责、威信、愿景。 [2015-03-27 17:27]

    [主持人]至此我们全部的嘉宾分享环节都已结束,现在有请主办方、课题组负责人伍刚总结发言。 [2015-03-27 17:27]

    [褚家炜]伍老师这个问题确实是特别贴近当代的青年,您问的这个问题,习大大交给中央政府是一样的。因为年初内部开会在讨论一个问题,其实就是如何利用将近九千万团员青年在网上的力量,相对来说发出这种正能量、发出好的声音,应该说我们也是期待争当中国好网民。总体上来说,确实有将近一个亿的资源,但是整体上来说还是有青年主体,还是具体在相对来说学校的青年更多一些,可能学校青年作为上网相对来说通过我们的数据分析,还是回到家去上网父母觉得不太好。我们想如何借用在学校以传统的思维,比如初中、高中甚至在小学,少先队的资源,如何建立更好的凝聚性、引导性,这个对于我们中青网来说,包括党中央加给我们的使命,确实这方面我们也是一直在做一个探索。但是我个人觉得反过来说,因为我自己听过这么一个段子,克强总理说过,我们在整个青年网发展中,我们也不但是把自己的眼光主要集中在青年身上,我们也是希望能借助青年继续扩散,青年群体的家庭概念,我们举个例子,一个孩子上面有父母,可能对于他的关注,不只是一个人或者两个人,可能是一个家庭,所以我们希望把我们的视角放在这上面。简单介绍这些。 [2015-03-27 17:26]

    [伍刚]我想问一下我们的同行,中国青年网,我们现在随着数据时代成长的这一代,那我们现在大数据应该说是在全球应该有一个三分之一人口的覆盖,实际上主宰未来的就是我们的90后、00后或者80后数字时代的领导者。我觉得中国共产主义青年团,他在革命战争岁月中,他是有一种的的确确像一种信仰吸引一代人,完成的一个国家的独立,然后带我们的改革开放的年代里边,他也是我们在工业化进行中,是我们这个改革的主力。那么在这个信息社会中,中国的年轻人,中国的年轻这一代如何在世界上实现大数据的虚拟时空中体现中国的独家的这种影响力,或者说软实力,刚才我们吴博士也是在前不久IMIT(波兰)教授我们也讲了就是说我们年轻人在这种现代的全球化的透明的环境中,中国的这种像我们这种官方的背景的、有中国特色的平台,如何向世界发出有影响世界的声音,我想问这个问题。 [2015-03-27 17:23]

    [高伟]感谢王韬宇的分享。当前微信这个已经有几亿用户的传播方式,已经不仅仅是一个通讯工具,而且让我们的移动生活变得更加精采。那么微信的公众号,作为一种全新的媒体形态,正在日益的冲击我们传统的媒体,所以在当下我们很荣幸邀请到了微信公众号的一位发起者,来分享他的经营过程。那么我们今天论坛的第一单元的演讲就到此全部结束了。接下来我们进行第二个环节,就是我们现场的互动环节,有请我们现场的观众来提几个问题,来和我们的嘉宾进行互动  [2015-03-27 17:22]

    [王韬宇]其实也没那么神奇,原创能力有限,怎么解决这个问题?刚开始的数据量比较小,数据分析可不可靠,怎么来?碰到问题就得解决,刚才老师说的素材没问题,我们通过本身他们有自己提供的一些素材,我们就取之于民用之于民。我组建的这个联盟,最初的想法是大家分享数据,通过这种分享,就可以让这种数据到一定的量级,这样就可以有一个参照性,就可以参考。那所谓大数据,对于我们,可能我觉得从数据的来源来说,没有特别较真的说纸质,这个数到一定的量化以后有一定的规定,大数据时代,我觉得要寻找数据的规律,数据是有规律存在的,如何去运用,不要纠结于来源,更应该是我们青年媒体包括各个行业应该做的,从点滴做起。包括我觉得像每个人对数据的理解应该是排斥的,可能国内的很多技术和信息到达不了相对高的标准,我们可以在这方面利用一定的资源,像我有外国的同学,他们在大学经常跟我交流,像我跟他提出来,说公众号如果发布文章,大家继续关注哪篇文章,我们可以做一些改变,获取这方面的信息,都可以运用。这种大数据的运用,除了媒体的实践,还有人们生活中的事情。生活中可能运动,比如说说的专业化的,可能有些人比较热爱,他们对数据的分析是有独特喜好的。他可以分析到每个球员往哪个方向上走,还有我们的团队有做一个APP是关于网球球员的球路分析,下一次击打的时候,都有计算,这些是无处不在的,只不过是用具体的数字来描述。 [2015-03-27 17:20]

    [高伟]我看百度新闻经常推送你们的消息,如何把自己的信息推送到头条,这是一个非常值得研究的一个课程。 [2015-03-27 17:20]

    [王韬宇]我们团队是五个人,但是我立了一些规矩,就像刚才老师说的,我给他们下了一些规则,我说把数据和指标要求转发率平均高于8%,日均阅读量必须达到五倍,如果没有达到这个标准,有一定的考核。每一篇文章出来以后,对受众的喜好要有分析。我每天就催这些受众的看点,看每天增长3恩%不多,其实这个倍数是很大的。有些朋友可能更专业的一些人士,他们在微信方面专门去做,可能做得更好。我是在这种非常孤立的情况下,团队经验也缺乏,没有专业媒体人的这种加入,我们就凭着自己草根的身份,没权没钱,怎么样去做到相对像模像样,比如说利用大数据。 [2015-03-27 17:19]

    [王韬宇]今天的这个主题是大数据说我运营自媒体的公众号和大数据是息息相关的,我觉得个人觉得跟各位老师比较分享可能还浅薄了一点,大数据在这个时代可能我个人觉得是更多机遇,为什么呢?因为像我们自媒体提供了一个依据,我们有一个对人群的兴趣有一个依据,为什么很多人做公众号几年都增不了粉,获得不了关注,我觉得可能对受众的把握清晰不到位。其实我们从腾讯方面能够获得的数据是非常有限的,一个是阅读数、转发数、时间点就仅此而已,那能做大数据,现在可能整个时代都是一个开关,我们如何利用现有的手头上的数据资源更应该思考。我们首先对这些数据,我们得学会发问。我是把我自己的内容认为是一种产品,就像刚才说的,这种转发、分享到朋友圈以后,它才形成了传播的价值,然后我就把这个分享出来,需要一个时段。所以说我在看这些数据的时候,觉得这个真的是大数据。数据大了,我把数据从死的变活的,这个是最重要的。 [2015-03-27 17:18]

    [王韬宇]和大家分享一下我对于公众号的一些想法,今天说了很多自媒体的事情,好像就我一个做这个的。我们这个团队不大,讲一个例子就是对方提供一个公众号两个月关注度就从零到十万,更好的是没花一分钱的推广,现在正在组建一个自媒体的联盟,这个过程中累计已经超过了500万,每个人的暴光量是千万级的。 [2015-03-27 17:17]

    [高伟]感谢华总的精采分享。华总通过技术层面和企业的微观层面详细的介绍了大数据对当下产业的影响,感谢华海涛。接下来我们有请国民内参公众号负责人王韬宇的分享,王韬宇通过搭建微信公众号的自媒体平台,在当下运营多个微信公众号每日发布消息,解析当代的中国听民生、聚民事在微信公众号上很好的宣传一些内部的信息,下面请王韬宇介绍具体的经验。 [2015-03-27 17:16]

    [华海涛]对精准数据来讲其实我觉得是现在一个最大的应用点。刚才我就从技术的角度说了一下大数据的这些事情。然后总结一下吧:现在我觉得是一个大数据的,我们赶上了这样一个时代确实是,未来可能会像王立新教授讲的非常精采,未来可能会达到那样一个理想的状态,一个完美的状态,就是说我们可以把中间的不对称造成的摩擦的成本降到最低,但是那个时代可能还比较遥远,目前我们能做到的事情就是认清形势,想清楚这个大数据这样一个概念或者一个技术对我们到底会有些什么样实际的应用,不要迷茫就好,谢谢大家! [2015-03-27 17:15]

    [华海涛]但是这里面一个最大的问题就是刚才上午也有嘉宾分享到了,这里面关于数据的准确性的问题。我们是不能相信的,这里面数据你不知道是哪一条不准确,所以我们认为整体就是不准确的,这里面不能单独的数据清洗,那你凭什么清洗掉某一条数据?它也许是准的也许是不准的,这里面是应用上一个很大的问题。 [2015-03-27 17:14]

    [华海涛]另外我在从业过程中还遇到一个例子,就是说有一个是跟艺术品定价有关系的,当时设计了29个纬度包括拍卖行的价格,包括大家的评价、评论、以及以往所有人的评价,这些东西通通弄到里面去,有不同的权重也不一定是线性的,把这些东西都弄到里面去去做一个应用点在哪里?就是说拿它去做一个艺术品的基础价格的一个估价。因为现在大家都知道艺术品价格是很混乱的,卖多少钱都有,那到底让消费者知道这个东西值多少钱,所以他们想了这个办法。 [2015-03-27 17:13]

    [华海涛]每个人都想去建自己大数据的中心,或者在技术上用了大数据的方法。比如说我们去年上线的味道网是一个农产品电子商务网站,那这个电子商务网站跟其他的很多电子商务网站有共性的地方,那就是我也需要广告,刚才褚总讲的很好,叫整合了各种广告资源同时做时实的数据分析,是我们电子商务网站具体的一个应用点。然后还有一点我们自有数据的积累,积累到一定程度比如想象一下每天如果能产生一万订单,这一万订单量每个人都会有一个评价,如果在评价上再有一个互评的话,这个数据量也是蛮吓人的,基本上意味着可能做一个普通的关系型数据库这样一个查询,一分钟或者10分钟,这样用户是等不了的。可能我们要牺牲掉一些精确性,然后用一些大数据的方法来把它搞定。 [2015-03-27 17:12]

    [华海涛]我经常跟同事或者朋友在一起聊天的时候就说,其实如果是我们讲阿里、京东他们所掌握的中国的消费数据可能比国家统计局的还要准。因为什么呢?因为里面的每一笔订单是谁的,它精确到分,每一分都不会差的。它能够明显的分析出来这里面有男性用户、女性用户,在什么年龄段所以这个是很精确的,然后还有像微博、微信,微信这个事情最新的版本刚刚开放微信的搜索,之前也没有开放搜索,数据在哪里?先存着,现在存储很便宜,他可以搞到这样的数据放在那里,什么时候想分析就可以去分析。所以说这个事情我们老百姓能感觉到跟我们好像没什么关系。但是多少有一点关系,但那个关系什么,我们可以去用,但是用的成本有多少这个不知道。  [2015-03-27 17:11]

    [华海涛]我先说一下大数据为什么现在我们很多人感觉像见不到它,见到部分到就对了,因为手里根本就没有大数据,大数据在谁的手里,其实就是数据生产者,我们从源头算起,每个人在文本框里输入一个词,那这个词就是精确的,服务器是可以记录下来的。那我们上亿的人甚至几十亿的人在搜索引擎里输入这个数据是非常精准的计算了像百度、谷歌这个数据当中去。包括语音、包括视频然后像电子商务其实最精准的是电子商务。 [2015-03-27 17:10]

    [华海涛]比如说像尿布跟啤酒的例子,好像是这样,这个例子我也是听了十几年了。大数据更多的可能是商家或者国际巨头用于一波又一波的创造新的IT增长点,然后可能很多人也不自觉的就卷到这个里面去了,所以我说我们普通民众是要认清楚这个问题。遇到了什么问题现在我们开始提这个大数据,刚开始讲了查询分析,这里面用传统的模型或者是工具研发解决。 [2015-03-27 17:08]

    [华海涛]为什么会有大数据这样一个名词。是因为就是说现在我们有很多每天产生出来的数据也不过结构化,当然里面也有一些结构化的数据,这些数据其实都是有用的,可能有些是在邮件、附件里面,有的是在数据库里面。他们之间又有相互关系没有办法用传统的关系数据库的方法进行查询分析。之前在2000年前后其实已经有这种概念,就是数据仓库和数据挖掘,非常接近于现在大家讲的大数据,所以说很多人就会在这个上面进行混淆。 [2015-03-27 17:07]

    [华海涛]我先介绍一下我自己,我姓华,华海涛,我是一个比较跨界的人,本科的时候读的是历学,工作之后是软件开发人员,十几年所以对于中国的IT业无论从自身的从业还是从旁观的角度来讲看的也比较多,从我个人的角度阐述一下我对大数据的看法。首先作为技术人员来讲我认为大数据首先要看本质,为什么出来这样一个名词,跟他比较接近的在2000年那个时候大家讲宽带,什么叫宽带,带宽到底多少是宽带,现在发展到了10兆瓦、20兆,刚开始的时候512K那个时候也叫宽带,所以这个事情是不准确的。大数据到底多大才算大,是不是一个GB的数据就不算大,其实我可以告诉大家本质上不是这个样子。 [2015-03-27 17:06]

    [高伟]感谢罗院长精采的分享。罗院长系统的介绍了我们中国新闻研究领域对于大数据时代的一些研究创新,同时也介绍了新闻传播学的领域人才培养有关的与大数据相关的内容,应该说非常精采,感谢罗院长精采的分享。接下来我们请易时科技的副总裁、技术总监、味道网的CEO华海涛先生分享。 [2015-03-27 17:03]

    [罗自文]最后我想说一下我们新闻传播教育大家知道,它是做新闻传媒的门槛很低,所以大数据给我们带来了很多烦恼,但是大数据也同样带给了我们机遇,就因为是大数据我们人人都是记者,但是不一定是好记者,但是对于我们新闻传播教育的学校的这种多年的积累和培养,有可能借大数据的东风我们学习它既要有我刚才说的三个基石,又也专业报道的技能,还有数据的这种挖掘的能力,那么这些显然不是一个普通的公民他的短时间的业务爱好这个层面能掌握的,这样的话我觉得我们新闻传播教育还大有可为,我们得感谢大数据给我们机会,谢谢大家! [2015-03-27 17:02]

    [罗自文]第二个新闻教育的基石需要渊博的知识,第三块才是娴熟的技能。新闻传播教育在很多情况下是不变的,变的很少。我们知道从新闻报道来说,它很多的情况下可以概括为叫新闻叙事,所以新闻叙事作为专业技能当中是一个基础,无论你是什么时候、无论是大数据也好,还是超大数据也好,那么这种能力它是永远不可缺少的。真正缺少的、真正变化的其实是一种传媒科技,那么传媒科技它的不同的年代、不同的地域是不一样的。由此我们新闻传播教育的一些学者我们继续编讨,我们忐忑的心稍微平静了一些。其实我们面临的环境并不是很完善。我们其实对众多的信息过来大数据把我们压垮了。但是我们经过梳理分析以后其实我们真正需要改变只是我们学生创新的思维和它运用的接受新技术的能力。 [2015-03-27 17:00]

    [罗自文]那怎么样应对这样的挑战?其实,当然今天我们是一个多行业的场合,其实我们新闻传媒教育我们也进行了多次的研讨,我们怎么样应对这样的一种挑战,让我们的学生他们经过新闻传播教育的四年的教育和培养以后,他们能够在将来的数据新闻报道这个领域当中或者是移动互联网这样的领域当中能够找到自己的用武之地。这时候我们就又想到,我们知道新闻传播教育他最早是来源于美国的,美国人他们在很早之前就提到了新闻教育的三块基石,这个其实在我们国家就是说当时我们大学的新闻研究会他们在进行新闻教育的中国化的时候,也提到了生根教育的三块基石,这三块基石是什么呢?第一块基石就是我们新闻教育要培养出具有崇高的新闻职业的理想。有理想、有追求、你干什么事情是愉悦的,你学习的效果和能力成型的时间就要少一些。 [2015-03-27 16:59]

    [罗自文]最后就是说可能机器人新闻,那就预示着可能随着互联网的发展,随着大数据的这种概念和理念的普及,有可能今后这个新闻传播的业态会发生变化,整个产业已经变成机器完全大部分新闻的工作,这是我想跟大家分享的第一点。当传媒碰见大数据会产生一个什么样的共识。第一个共识讲完了,我们作为新闻传播教育者我们心理是非常忐忑的,因为我们现在新闻传播教育碰到一个最大的问题就是我们大家都知道的一句话,就叫计划没有变化快。比如说前几年我们刚刚进行课程改革,当时还是多媒体,然后在媒介融合,在微博、微信、移动互联网,现在我们还没把这个方案弄好,现在来了一个叫所谓的大数据,或者是数据化新闻,或者是可视化报道。这个给我们的传媒教育应该说提了一个非常大的挑战。 [2015-03-27 16:58]

    [罗自文]第二种我们讲的是叫计算机辅助新闻报道,这个它说的是什么概念?数据新闻它和传统新闻在生产方式上是不一样的,那么传统新闻我们生产我们通过比如说记者、人才本身和它的采访、他的编辑和报道进行整合。而现在我们很多的比如说新闻线索的获取、数据的这种挖掘、然后整合都是由计算机来做的。而且我们现在知道有的机器新闻的话它有支撑的记者写好模板,做好相关的关键自带,这样的话产生不同的新闻。最后我们可以看到可视化新闻,可视化新闻它其实说的是数据新闻呈现的方式,但是你不可视化的结果是什么?不可视化的结果是看不懂就不看你所谓的高科技,可视化了觉得很清晰,上面几个专家做的可视化的展示觉得特别有意思,我相信它的传播效果也会很好。 [2015-03-27 16:56]

    [罗自文]我主要从事新媒体和新闻教育,所以我今天想跟大家分享的是当传媒遇见了大数据会有哪些故事,这里面我想有三个方面的思考,第一个就是说当传媒碰到大数据可能会产生某种结果,这种结果对我们从事传媒教育来说是暂时性的。数据新闻并不是这几年就出现的事情,数据新闻可能发生、发展有它的一个前世今生的几个阶段。最早的就是数据新闻它应该是精准新闻报道,精准新闻报道主要是要利用比如说社会科学的一些方法来进行调查分析、为它的报道进行客观、公正的报道的理念。在此之后出现了第二种形态,第二种形态我们叫计算机补充报道内容,我们知道叫CAR,我们知道基础工作在很多行业都有,尤其我们新闻业,在比如说装饰设计里面他这个理念很突出。但是在这里很不一样的就是说早期的计算机并不直接产生结果。第三个阶段就是我们现在目前的这个阶段,我们叫可视化新闻,可视化新闻这个概念可能有广义和狭义之分,广义的可视化新闻可能包括我们的电影、电视,特别是电视新闻的平台,狭义的可视化新闻指的是什么?指的就是我们现在所谓的数据新闻进行视频化。但是现在还有在欧美他们有一些公司从事信息服务和新闻报道,但是它员工实际上有限,但是机器设备很强大,由此就产生了机器人,这个公司90%的新闻都是由机器来产生的,这样的话就是我们可以看到数据新闻它的四种不同的形态,这四种不同的形态每一个原生的形态反映了我们数据新闻的一个侧面特征。讲到精准的新闻它其实说的是数据新闻的价值,它和传统新闻是不一样的,它可能更准确、更客观,更能够被我们的公众和受众所认可。 [2015-03-27 16:54]

    [高伟]中青网过去一直致力于青年的创业和城台,刚才听了褚总的介绍,阐释了大数据领域的实践,对青年人成长有巨大的参考价值,所以感谢褚总编的精采分享。接下来请中国青年政治学院新闻传播学院执行院长罗自文先生的分享。 [2015-03-27 16:54]

    [褚家炜]最后,我觉得大数据时代对于媒体来说是一个好的时代,其实也是我们中央媒体确实面临的压力也是非常大的一个时代。大家看到2012年开始国内两家非常大的视频网站情况如何,而且我觉得大家可以看到在视频网站上片源更多,我们能看到的资源更多。其实背后没有大数据的支撑使它最终得到的还是将近几个亿的用户量,得到了用户掌握了整个互联网的发展的根本。另外,我们可以看到大概在2013年前后我们国内可能说法不是很准确,最大的一家门户网站实行的门户、微博、视频、包括无线端的整合进行网站的全面延展,我想这背后的支撑没有大数据是根本达不到的,最后大数据确实是机遇、也是挑战,所以我们也是抱着学习的态度,也是争取在大数据上收获更多的信息。 [2015-03-27 16:52]

    [褚家炜]第二个你有了方向,有了内容的定位之后需要技术的支持,技术我们在大数据方面对于我们网站来说利用很多方面,一个可能在信息的采纳、收集然后信息的评判,包括引擎的分析、包括资源的调配,甚至我们在绩效考核上都可以用到大数据。然后中国青年网也是今年成立了云计算中心,大家也都知道云计算和大数据基本上是对孪生兄弟,所以我们对大数据这块也是非常重视,我们在云计算这块做了规划未来的发展目标,未来三年终信要建成存储,带宽达到400台速度,我们在技术方面会做很大的投入。第三个方面可能技术上要投入,经营还是要收支挣钱,作为大数据来说近几年BST广告在整个互联网行业蓬勃发展,基本上从2012年整个BST广告快事兴起,现在基本上国内的广告公司都开始积极的发展BST广告,对大数据来分析用户的行为,根据用户的年龄、包括学历包括收入然后匹配相应的广告,在整个广告转化率可以达到非常高的一个水平。 [2015-03-27 16:50]

    [褚家炜]谢谢大家,用半分钟的时间简单介绍一下中国青年网,中国青年网是1999年成立,是中央网站,同时是官方网站,中心网成立十几确实在整个服务青年上做了很多的事情,也给大家分享些数据,在2014年底是中央网站的第一名。中青网这么年的发展,虽然大数据这个概念提出来确实我们也做了一些有利的探索,下面我想从三个方面给大家做一下分析,也就是作为媒体最重要的就是内容为王,从内容上来说,内容如何利用大数据来帮助进一步的发展。而且来的时候也看到一个数据是关于美国的互联网中心,大概互联网新闻网站两年就会翻一番,所以对于互联网站是一个海量的数据。而且在自媒体蓬勃发展的时代,我们舆论场合前几年也发生了很大的变化,任何一个媒体人或者任何一家媒体可能说我可以完全的做到信息的独有,或者说我完全站到信息的制高点。而且作为媒体人来说,任何一个媒体可能它原创的力量或者现场出去采访的记者相对来说人数还是受到限制的。可能新的时代,尤其是作为一家网络媒体如何利用好数据,让后方的编辑更多的利用信息的加工来提取更好的数据可能是我们面临的一个很重要的一个难题。在这儿我们大数据可以帮我们解决很多问题。首先我们可以了解到用户的诉求,另外我们可以根据用户的诉求把它提供相对来说精准的信息服务,我想大数据在于中国青年网未来的发展确实在一个摸索的道路上,同时我们的技术相对来说发展的也不是很快,所以刚才听了前面几位专家的讲述确实我自己受益颇多。 [2015-03-27 16:47]

    [高伟]尊敬的各位嘉宾、朋友们下午好,根据大会的安排我们现在进行我们第四场的论坛,我们第四场论坛的主题是大数据时代中国青年媒体人成长论坛。我们论坛的主题是着眼于大数据时代中国青年媒体人的学习、成长、成才。那么大家都知道,大数据时代彻底的颠覆了我们传统的社会,那么在今天的社会形态下,大数据就是带领了随着我们社交媒体和各种数字技术、信息技术广泛深入的发展带来的一个新的概念,那么在这个概念条件下我们中国青年媒体人如何适应这一特定的技术环境有效的认识大数据时代的种种机遇和挑战呢?今天我们有幸请到我们四位嘉宾对大数据时代中国青年媒体人成长成才的问题进行有利的探索。希望他们能够分享出有益的答案。我们中国青年媒体人成长论坛接下来将进行两个单元,第一个单元首先由我们的现场的嘉宾对刚才我们说出的问题就是大数据对于青年媒体人的成长、成才的机遇和挑战这一基本的主题来进行一个有利的分享和探索。第二个环节将与现场我们的朋友们来进行互动,进行一个提问环节。首先有请我们开始第一场,首先有请我们中国青年网副总编褚家炜先生精采分享。 [2015-03-27 16:46]

    [主持人]感谢各位专家对大数据技术的观点分享。接下来,我们有请、北京大学公共管理中心研究员高伟主持"大数据时代的中国青年媒体人成长"论坛。嘉宾有中国青年网副总编辑褚家炜、中国青年政治学院新闻传播学院执行院长罗自文、国民内参公众号负责人王韬宇、味道网CEO华海涛,有请各位上台。 [2015-03-27 16:45]

    [秦雯]谢谢四位专家,我们刚才最后一个问题是讲切入点和切入方式问题,我觉得四位专家都已经谈到了,切入点的话有两种模式。一种模式就是现有用户的用户需求。当然还有一种更创新的模式,也更革命的模式,更能让王教授激动的模式是创新应用,因为从零开始,怎么站在基于大数据来思考或者说基于用户的个性化需求来思考,去创新应用,我想这两点的话,对我们在座的今天在媒介的这些企业来讲的话肯定都有借鉴的。但是从切入方式来看,大数据一定是跟网络密切相关的,我们今天在谈互联网,其实我们以前谈物联网,现在更新的说法是万联网。在那个时代,可能数据是无处不在的。另外一个就是交互性和全过程,这三个网络化、交互性和全过程,我想这三个关键词对我们真的能够赶上大数据这个时代、这趟列车是非常重要的,也希望这样的讨论,能对大家有借鉴、启发这样的意义。谢谢大家!谢谢四位专家! [2015-03-27 16:43]

    [吴昊]因为我们好贷网是一个新兴的行业,是起一个牵线搭桥的作用。因为本身我们在刚开始成立的时候,我们对大数据还没有一个我们自己的概念,因为我们觉得把搜索做好就好了,但是后来发现我们的客户包括我们的用户在服务过程当中,他们会有一些痛点,所以对我们来说,要做就专门解决这样的用户的问题。其实对我们来讲的话,切入点就是用户的需求,一方面是我们之前做的不足的地方,另一方面是整个市场大的机会。比方说我们现在在大数据的应用方面,一上来比较浅。就是说这需要什么样的数据,那我们想办法帮他去挖掘这一块的数据,或者调用这一块的数据,那不同的信贷机构,他不可能每一家都建立专门的机房的服务器做同样的事情,所以我们会搭一个平台,对他提供一个统一的集中化的应用,免除一些所有接入的成本。当然在后续的运用成本我们也做相关的事情,整个偏小额的消费信贷的发展的方向,还是说由机器自动判断一个人的信用状况,然后最终做出一个信贷的决策。那国内和国外也有部分的公司实现了这样一个初期的效果,但是我跟大家分享一个比较有意思的案例,就是说之前我们的合作公司来联合做的维期几年的数据,就是在谷歌上面搜索借钱不还会怎么样的,搜索这个信息的客户,按我们逻辑上来推理的话,你都有这个心了,说明你是动这个脑筋的,应该说风险还是比较大的。他们做了一个比较长期的统计来看的话,有搜索这块内容的和没有搜索内容的,实际上坏账率基本上是一样的。所以可能很多一些跟一个人的,比如说跟他的社会行为,包括他的一些社交或者在电商上面的行为,到底能不能真实反映他的还款的能力,或者还款的意愿,这个我们现在还处在一个探索的阶段。但是对我们来讲,现在当务之急是解决掉,尽我们最大的能力,从某种程度上解决信息不透明的这样一个状况,我觉得这是我们用户最大的看点,我们以这个角度来切入,做大数据的研究。 [2015-03-27 16:40]

    [朱垒磊]就像刚才老师说的,如果把媒体,像电视媒体传统的可能大家是回归这样的数据,但是我觉得电视媒体比如说现在你的电视媒体是在小米电视上放的话,其实你知道是哪个用户什么样的习惯的人在什么时间段看哪个节目的,这个要比靠调查的那一万个用户来的才是真正意义上的大数据更全面。所以我觉得对任何一个媒体来说,他的大数据的第一步就是有一个详细的信息和机制,刚才说的是电视媒体。那如果是像央广网这样的网络媒体,当然就是它的后台的所有每一个页面、每一个点击、每一个用户的行为都要记录,如果是APP端的媒体,那自然也是他的每一个按纽、每一个频道的浏览,在这样的基础上才能做个性化的推荐或者是广告结合的操作。 [2015-03-27 16:38]

    [钟宏]我们公司主要是电视媒体比较多一些,中央电视台、北京电视台,像电视台的话也是和新媒体融合,重点还是在传统行业那一块。在传统问题上,因为传统媒体它主要是商业说的网络,搜集数据是比较困难的。我想大数据的这个特点在于偏智能,以前他获取数据都是抽样的。应该是新媒体和传统媒体融合点在哪,通过新媒体融合,来解决大数据传统问题上的弊端。 [2015-03-27 16:37]

    [赵勇]其实我非常赞同王老师王立新的观点,现在的大数据时代就是王老师说的你要做一个企业、做一个项目,你是不是能够获取数据、获取用户,第一个切入点是获取用户和数据,第一个我们面向的是教育,因为教育是所有人的刚需,我面向中小学,我们的切入点是什么呢?当前教育最紧缺的实际上是教师资源,现在所有在线资源的产品,我把老师的课件放在网上,我把一些习题、答案放在网上,他是打通你学生和老师、答案的边界,他能快速获取。但是他没有解决老师时间不够用的问题,没有解决孩子时间不够用的问题。我们现在采取的方法是能够逐步用机器来替换技术方面高端的人才,以前是机器向工业革命,用自动化的程度的提高来替代简单的劳动力,我们要替换高级劳动力。我们的教育产品,我可以替换高级的老师来给孩子做主观题的角色,不是填空题的形式。我可以把机器做推导,我能逐行来批改习题,这样解放老师不用改卷子了,可以针对学生做个性化的辅导。同样我们做一款中医产品、医疗产品也是,我可以用及其逐步来中医或者是西医代替它的智能,可以给每一个病人去看病,提供个性化的健康辅导,所以我讲了两个关键切入点,第一你要获得用户和数据,第二是个性化,现在00后、90后要追求自己的个性、发扬自己的个性,那我的大数据最终就是要很精准的数据从每个用户的需求,从生活、工作的需求,像亚马逊的总裁,他说未来亚马逊的方向是为每一个用户建立一个亚马逊的网页。我就说这两点。 [2015-03-27 16:35]

    [秦雯]非常好,其实我们看到这个讨论过程当中,一个最大的特点就是其实技术是和应用,是大数据一件事的两面,它是不可分的。但是在这一点的话,我也是在行业里边经常以批评的态度,在说一件事情。就是我们很多传统的IT所谓供应商、ISV,他们华丽变身变成一个所谓的大数据公司,他们实际的目的就是想卖他们的服务器或者是卖他的软件。其实这样的我觉得是不可取的,真正所谓的大数据应用,因为技术是来实现应用的,一定是跟业务密切结合起来的。那我想我们再来问最后一个问题,因为今天的会议时间比较长,刚才北邮的王老师给我们描绘了一幅非常美好的蓝图前景,最终是达到共产主义,但是那个我相信离我们比较远,因为事情还得从脚下做起。我想请四位专家,因为我们今天的主题是媒介变革,作为一个媒介,媒介现在非常泛滥。作为一个媒介的话,如果我们真要能够抓上大数据时代的尾巴,赶上这趟车,切入点是什么?你们有没有好的建议给大家?或者是切入的方式。我们用这样一个大家的献计献策我们来结束我们今天的讨论,请赵总开始。 [2015-03-27 16:33]

    [赵勇]我们接触这个行业比较多,我们一方面是国企、央企、政府部门,他们才有大量的数据,另外我们还有很多的消费者的数据,我们全国有十几亿的人口。那像央企和国家部委的难点前面几位都提到了,用户需求还有用户对大数据的理解,这方面还不稳固。举一个例子,比如我们给民行,我们做数据挖掘。他说请你帮我们挖掘一下有价值的用户,我说什么叫有价值的用户?你们怎么定义?他说我们也不清楚,需要给他梳理整个的业务数据、业务流程、跟用户的交互,梳理出几十个特征,在这里面去摸索。第二个难点,他现在从传统的IT架构从大数据架构来说不是一蹴而就的,他需要有一个过程。但是很多企业和行业都是拿到方案,比较特别成熟,而且能够在很短的时间内能够实施,这个实际上我们需要综合的来评估,在企业里面去实施,它的关键业务比如国家电网做调度性,因为它沉淀了几十年的东西它确实需要改造,但是我们首先对业务不了解,其次你做的不好,全国的公输电就瘫了,所以我们从基础的用电信息采集这方面条件来做,所以它实际上也个切入过程的成熟过程。第三方面的难点,像现在你比如说咱们的平原城市,然后还有机场,一个机场监控,我有一个朋友告诉我说北京机场可能有几万个摄像头,真正在看摄像头的工作人员有几个人。他对机器化程度和实时性要求非常高,这种系统不是一下子就能搭起来,它需要很多个面向不同渠道的大数据过程。不是我拿个大数据产品我就能解决所有行业的问题,我需要结合许多大数据才能给他提供解决的方案。 [2015-03-27 16:30]

    [钟宏]我想我们做大数据应用的时候,我们需要解决应用价值,因为做一个大数据应用系统的话,需要做很多的数据。那么它从以往应用说话来讲不太一样,以往的应用跟用故需求比较清楚,用户他也知道流程是什么样子的,数据是什么样的。那大数据的话,往往用户他不太清楚这个应该怎么去做,那就是需要我们的技术人员对用户的业务上有非常深刻的影响,要深刻的理解,这样的话才能够充分的认识这个问题。因为有许多的用户目前的话他可能往往有特殊情况,有跟风,就是说大家都在回答问题,但是特并没有想好怎么好去做,做不好的话你可能花了很多的钱,但是没得到很好的反馈。所以你要正确的去引导,让大数据发挥真正的价值。 [2015-03-27 16:29]

    [秦雯]好,谢谢 [2015-03-27 16:29]

    [朱垒磊]第一个解答可能就是刚才信息孤岛问题,就是具体到某一个行业里面其实数据更多在被某几个媒体或者某几个大公司或者是在任何一个行业,也就是说我们整个市场上,大数据还缺更多的平台型的产品,平台型的产品打通了某一个行业里的数据壁垒,才可能有更多更丰富的数据出现,所以这个回答里面也包括了我启动的第二个问题是行业性的应有更少了,我觉得大数据通用型解决方案更多是偏架构层和可能算法层,但是应用层一定是到具体的行业。比如媒体大数据领域这种,很多其他的领域可能大型的汽车领域、金融领域像好贷网这样的民营企业,还是有很多细分的领域,准确的说需要更多的数据平台的出现,才能够打破技术的需求和应用之间的壁垒。  [2015-03-27 16:28]

    [秦雯]请朱垒磊 [2015-03-27 16:27]

    [吴昊] [2015-03-27 16:26]

    [秦雯]或者说资源的丰富性。 [2015-03-27 16:26]

    [吴昊]我觉得其实整个从信贷行业的角度来讲的话,其实信贷行业最核心的东西就是风险太紧,其实就是信贷的本质就相当于两个互相不认识的人之间要发生金钱的这样一个关系,在这样一个过程当中,就涉及到需要资金的一个需求方,需要提供他的一些信息或者他的一些数据,能够便于资金的供应方更好的了解它,并且把这个钱顺利借给他,这就是一个大概的过程,一个逻辑。在这个过程当中的话,就会存在信息不对称的问题。包括像我刚才举的法律诉讼的问题,如果说信息的需求方不把控,把他有被别人告多少次的数据提供出来的话,那作为信息的资金的供应方来说还是比较难以判断的。当然我们可以通过自己公开的法律判断,对这个问题进行一个解决。但是很多数据它是非线上,比如说他在民间借贷这个领域欠多少钱只有他的心里是最清楚的。当然还有小的贷款他没有办法获得央行征信的报告,也就是说信息孤岛的状况,其实是在信贷方面比较严重的一个情况。当然从技术上来讲的话,对于不同信贷机构之间,或者说对于信贷领域的不同细分的参与者之间的话,我觉得从技术上是没有太多的问题,因为本身这个领域跟营销不一样,这个领域都是一些偏结构化的数据。所以主要问题还是对信息不对称这个问题的一个解决。 [2015-03-27 16:24]

    [秦雯]谢谢,实际上这个讨论已经从技术范畴到了应用范畴,因为大数据实际上最终体现价值还是到应用,所以咱们在谈技术的时候,其实是刨开应用的。我们把下一个问题再集中一些,就是在你们四位,你们自己在做大数据的应用过程当中,你们觉得技术的难点或者痛点主要在哪方面?因为我们现在在说,因为我们公司也是做大数据的,经常听到两边抱怨。应用那边老抱怨技术老不到位,反过来技术那边老说需求过不来,老有这样的矛盾。所以听一下你们的看法,难点和痛点在哪?你们有没有好的解决方案?还从吴总开始。 [2015-03-27 16:22]

    [吴昊]大家下午好,我是好贷网大数据这块的负责人,我叫吴昊。因为刚才几位老师讲的对大数据这一块的认识,我还比较想说,从我们好贷网自身的角度来谈一下我个人的看法。是这样的,我们好贷网是做贷款的垂直搜索的平台。我们在对客户来提供信息的一个匹配的这样一个服务过程当中,我们也会发现客户的一些痛点,比方说我们在把贷款的搜索者就是所谓的借款人匹配给不同的信贷机构的时候,我们把关联度作为一个问题。可能比较优质的人,他会选择的地域,比较低的信贷机构,这样的话信用状况还有整个资质稍微偏低一些的话,他可能希望去选择地域稍微高一点,但是也能给他批贷款的这种。所以在这样的匹配过程中,我们会帮助客户来做更好的匹配,这是第一个领域。第二个领域就是我们在跟我们配合的现在全国有七千家在跟我们合作做配合,在配合的过程中,我们除了给他提供数据之外,我们也提供一些风控相关的数据的服务,打一个比方,比如说一家企业申请一笔贷款,这家企业可能带不同的地区,它跟别人都有法律的纠纷。但是,如果是让这家信贷机构自己去在全国的几千家、上万家的法院的网站上面,一家家查是完全不现实的。我们现在就有提供一个,我们搭了一个"云风控"的平台,也是基于数据应用方面的一些服务。这个平台就可以提供我们基于可以把它说成是一种数据挖掘,就是全国所有的网站上面,抓取的一些公开开庭的记录,包括现在这些网站上放的记录都是新的,开庭以后这个案子结了信息就撤下来了,但是我们有办法把数据存储下来。存储下来之后,我们就可以看到现在有没有法律的风险,还有过往会不会对别人产生一些产量质量方面的纠纷,这个直接对他的履约能力、还款能力有非常直接的关系的。还有包括借款人他有没有在互联网上频繁的申请贷款,这也是反应他资金紧缺的状况。那么他借了一笔钱之后,这样我们也有一个方式能够把这一块的数据做一个整合。如果说他出现了一些非常高风险的行为的话,我们还可以针对信贷机构设置的一些规则,能够对他们的风险进行一些揭示。因为我们主要还是服务于一些信贷机构,我们对信贷机构提供的是基于数据的这两个机构,这是我对信用模式大概的介绍。 [2015-03-27 16:20]

    [朱垒磊]刚才各位老师也说了,大数据的应用体现在说有大数据的架构、大数据的存储、大数据的采集和大数据的分析,那我们公司夏唐科技包括今天我们在这研讨会的主题,可能更多的是针对咱们的媒体数据以及咱们的商业消费领域有哪些大数据,在商业消费领域的大数据的应用上,我们觉得企业它在正常的生产经营过程中会产生各种维度的数据,其实这个数据的量就像王立新老师说的,不能说一个TB叫大数据,或者一个更大的量是大数据,可能每个企业面临的情况不同,不同媒体所能产生的大数据的样子也不同。可能对于像百度、新浪这种级别的大数据的媒体平台来说,它的大数据的量级,如果不用大数据的规模,而是用实力的数量多少来论的话,可能每天都要上几十个亿的浏览或者几百个亿的资金,考虑到大数据的当量。但是对于很多企业内部的生产、运营的数据来说,可能一家传统企业,可能在十几年的工作中积累百万级或者几百万级的用户的人的数据,它已经是非常宝贵的一个价值了,可能后面好贷网是一样的。我相信不是一个度量上上亿级的,而是百万级的甚至几十万级的。就类似像今天早上咱们有保时捷的朋友,那如果说全国跟保时捷的用户相关的数据,百万级是非常不错的数字了。所以就是说这个是对大数据数据规模上的理解,我们在分析里面会牵涉到企业的营销数据,营销数据可能更多的体现在网民上网浏览的数据,也包括有企业在它的市场活动中留存下来的数据,包括我们叫消费者在他的网站上在他的点上网站上搜集来的消费者真实的数据以及包括我们今天的渠道数据。也就是说在媒体变革的今天,可能不只是一家两家媒体能够成为一个对企业有价值的渠道数据,它的渠道数据的量本身可能就是有几千、上万甚至是上百万的级别,如果我们把每一个零散的微博自媒体、微信自媒体、APP自媒体都看成是媒体的话,那么渠道本身的数量也是可能是百万级的。所以说在这样一个背景之下,业内包括我们公司可能更多的是从事的服务,就是如何把一个企业它的市场数据和它的营销导向的营销数据,中间做一个勾连。也就是说对于企业来说,它有不同类型的数据,我们在这个领域里,我们其实都是结构化数据,但是我们把它叫做一元的结构化数据,也就是说叫做(英)结构化数据。那么这个一元的结构化数据对于任何一个企业来说,它要想建设这样一个(英)平台来管理的话,牵涉到很多应用层的困难,应用层的整合困难。那么,在这个意义上,我们最需要梳理的其实就是两种类型的,一种就是我认为刚才提到的基于Cookie的经销数据,一种是基于人的市场数据。那在这两种数据之间,其实我们提供的不仅仅是数据服务,甚至是依附于数据的运营和人的智力性数据,这样才有可能让这样的数据真正形成一个起作用的闭环,让系统软件、数据和人的智力在一起,才能够形成一个商业价值。在这个里面,也牵涉到刚才提到媒介本身也会成为一种数据形态,社群也会成为一种数据形态,这就是我大概的理解。 [2015-03-27 16:18]

    [钟宏]我是北京中视广信首席架构师钟宏,那我们可能跟许多单位不太一样的,我们是一个公司,今天来了很多单位大多数都是学校科研机构,一般的话大家认为公司有很多项目,但我们公司的话就是做信息的研究,我们专门有一个新技术的研发实验室,专门对新的技术进行研究,包括大数据等等,这里面大数据这方面,我们很多专家都作了很多解释。我想从它的技术区别稍微说一下。现在就是说我们一谈大数据,就介绍一下应用的案例等等,我们往往看到似乎像是统计的应用或者数据挖掘的应用,好像分不清楚到底这个区别在哪。其实我想说统计的话,它主要是针对大的数据,比如说我的企业或者交易所,它产生大的数据,得出来一个总量的数据,通用于各种各样的方式。那像数据挖掘、数据仓库的话,它的数据主要是来自于结构化的数据,那么它就不像统计,统计主要是多了一些数字性的统计计算,那数据挖掘的话,就是我们在数据库里面的数据,比如说这样的一些东西,就是文字的这样一些信息进行挖掘,还有它们之间的联系。当然这些数据在数据库里面,也是提了提,我们往往在结构化。大数据的话,它主要是来自应该是一个互联网方面的应用,它的数据是基于互联网发展的。而且它的数据是非结构化,就是大数据并不排除数据挖掘,它里面包含了很多数据进一步发展,那么它应用到许多统计学里面的,还有数据挖掘等等这样一些东西。当然他说分布式的技术,分布式计算来对这个问题。总体的区别差不多就介绍这些。 [2015-03-27 16:09]

    [赵勇]我是清华大学大数据处理中心的赵勇,我们这个中心实际上是在2012年就成立了,可以说是国内比较早的从事大数据平台行业应用的一个机构,我们这边对大数据的理解,我们把大数据技术分成五个层面,最基础的就是我们叫基础架构支持,那么包含现在的数据中心、服务器、存储网络等等,这是最基本的。再往上就是数据采集,当然大数据的起点就是把大数据拿到,如果没有数据,大家说大数据就是空对空,拿过来以后就要存储。其实做存储大数据世界上有很多的公司做这个很多年,它对规模和存储的时效性、吞吐量这方面都有很多的要求。数据存下来就要进行处理,绝大多数做大数据是在大数据处理层面,包括分析、统计、查询、商业智能包括现在最新的深度学习、机器智能这方面都属于数据计算和数据处理。处理完之后,拿到这结果,就需要进行结果的展示和交互,那么以前像图表,还有现在比较流行的信息图,再有最深的像这种增强现实,体感交互,这些都是大数据最终的展示和交互这方面的技术。那么具体的,我们做得比较多的中间层面就是大数据处理,我们又分成三个部分。首先是离线,就是P处理,特别大量的数据不可能一秒钟就处理完,可能要几个小时、几天甚至更长的时间。那么现在随着信息爆炸的年代,对于数据处理的要求有时效性的要求越来越高,大部分像类似数据库的查询,我们要做交互式的。也就是说我问一个问题,我希望几秒钟或者一秒钟之内就能得到回答,交互式的处理。要求最高得有电网和平安城市实时监控,数据要马上实时的能够得到反馈,这是第三个层面。我们对大数据的一个相关理解。 [2015-03-27 16:07]

    [秦雯]大家下午好,听了一天了,也是比较累。听起来,咱们这个环节好像是最抽象的,所以我们尽量跟嘉宾一起,用一种深入浅出的方式,来分享一下对大数据技术的认识。一会儿,我为了节省时间,我就不给各位嘉宾介绍业务的时间了。待会儿请各位介绍自己正在做的业务或者项目讲一下大数据的技术。首先还是从一些基本面入手,我们知道,大数据这个概念已经火了好几年了,昨天我看到有一家新华社发的新闻,国内一家做服务器的公司,号称要做中国的数据网络。其实在我看来的话,它有点偷梁换柱的。所以我觉得,我们今天还是有必要去跟大家一起,我们不一定是澄清,因为可能这个事情每一个人有不同的看法,就是提供更多的角度,来谈究竟什么是大数据技术,就是跟大数据相关的技术有哪些,这个范畴是怎么样的。咱们要么这一轮从这开始,请您先讲好吗? [2015-03-27 16:06]

    [主持人]感谢各位专家对大数据时代的版权管理的真知灼见。接下来,我们有请缔元信.网络数据CEO秦雯主持"大数据技术"论坛。嘉宾有好贷网CEO 李明顺、北京中视广信科技有限公司首席架构师钟宏、清华大学苏州研究院大数据处理中心技术官赵勇、夏唐科技CEO朱垒磊。 [2015-03-27 16:05]

    [郑铁男]所以对于编辑人员的培养,对于文科专业的学生我自己认为就是编辑在大数据时代、在移动互联网时代你们的培养的就是什么?你们就是一个产品经理。什么叫产品经理?你就要自己去想一个产品如何去做,如何进行设计,如何进行推广,它的定位是什么?如果你能做成这样的产品经理,你可能就会在移动互联网时代就不会被淘汰。好,谢谢大家! [2015-03-27 16:04]

    [郑铁男]第四个是数字出版人才的培养,我觉得大家都知道这个软件Axure RP,可以帮助我们编辑出版文科类的学生去画一个图,我们尤其是学编辑的学生大部分都是文科生,发散式思维,所以你说出来这个产品想做一个东西你跟技术人员交流其实是经常听不懂,你会觉得我怎么是这样想,为什么他做不出来,而开发的软件公司运营商会觉得你提的太发散了,所以这个软件可以训练我们学生的逻辑思维能力,可以把你的想法,比如说你从这儿跳转翻阅旋转效果中间有几个键完全用这个软件从那个图库里面选出来,就不用IT的人员给你做出来了。所以它有个好处就是帮助你理清你的逻辑思维能力,第二个不大依靠技术人员就能够把这个产品设计出来。所以我有幸去讲课的时候,我的PPT被一个研究生拷走,就在北京找到了工作,落了北京的户口。所以它不是一个纯技术软件,所以在网上也有很多可以去下载一下。 [2015-03-27 16:03]

    [郑铁男]大家看到的这是我们给一个出版社做的关于教学的辞典全部的维护,包括它的词组、人称代词。这是国外的标准体系。大家看到的是从一个词到列外一个词,其实计算机不知道你这个是什么词,能分析从这个词换到另外一个词,我想刚才北大的老师已经讲了李彦宏的做法,其实看看这个表就是你要找的中间那个总的结构,其实通过别的一些词都可以转到这个词,所以对于你来说就用大数据的时候把这些知识点、关联体系要建立起来,这个才是我们要做的,从大数据变成小数据,把这个知识体例建立起来就会提供精准的服务! [2015-03-27 16:02]

    [郑铁男]给大家举个例子。这是人民卫生做的医学数据库,然后有参考数、有病例、还有药物指南、有视频等等,它就是把它的内容碎片化处置。然后你打一个高血压可以马上找到。然后你找到高血压之后大家看到右边是高血压相关的药物都是什么药跟高血压有关系,症状是什么?然后相关手术操作怎么去操作,动手术,怎么样去做相关的疾病,还有相关的实验检查,只有这种服务提供给客户,客户才会为此付费。并不是说大数据时代我们数据就要大,而是通过数据创建一个小的数据服务。这里面因为时间关系就不再细讲了!大家看到也可以进行跨部检索、语意检索,知识关联然后进行知识提取,通过这样的服务就可以赚到钱,可以给客户提供服务。这就是我们创业的技术平台,如何去创建这样的知识库,可以对知识点进行标引、加工,然后建立节目、录像、建立词表,建立他们的分类体系。 [2015-03-27 16:01]

    [郑铁男]第三个非结构化的数据都是零散的数据,没有组织性,客户需要吗?我们现在这种模式就是这种检索的模式,搜索的太多了,这个时候也不是客户需要。所以客户需要是什么呢?在短的时间内为客户提供的内容是他需要得到的,所以我们还是需要把非结构化的数据变成结构化的。也就是说我们要利用大数据的这样的技术提供小数据的服务。只有提供小数据的服务客户才需要,才会为此付费,完全的海量数据像百度搜索一样其实客户是不会为此付费的,所以我们要设计这样的产品。 [2015-03-27 15:59]

    [郑铁男]有的时候我们经常会讲中国要有自己的标准,在互联网上中国不需要自己的标准,为什么?因为互联网是美国人搞的,我们建了标准是自欺欺人。所以第二个信息化要求的是信息共享和分享,我们建了自己的比的东西跟别人交换我们就很难,所以要采用国际上通用的标准体系去建立出版业的标准,所以在前段时间中央出版社转型的时候都开始采用国际上的通用标准。这个XML就不讲了,今天也不是讲课。大家看一个片断,这就是我们的一本期刊或者图书,大家看有蓝色、绿色、黄色,我们把它碎片化处理之后,大家看就是把所有的蓝色聚集,黄的聚集,然后还可以进行重组,形成新的产品。这个产品也许是个卷子,也许是一套题,也许是一个手册。同时,我们看到现在的所有的电子书京东、亚马逊所有的格式都是基于XML转出来的,这些都不讲了。当当、京东亚马逊这些格式我就告诉你所有电子书的格式都是基于XML转化的。所有我给大家介绍的数据库、知识库都是基于他们企业的一个XML的标准然后生成出来的,所以我们需要把我们原来的数据从结构化的数据要变成非结构化的数据。 [2015-03-27 15:58]

    [郑铁男]所以要把我在其他的行业里面讲的时候,大家都知道xml是什么?我们的纸书,我们其实是个馒头,但是我们现在客户变了,像王老师这样喜欢手机的人,那他需要的是饺子,需要的是面条,如何馒头变成饺子,如何馒头变成面条,那馒头永远不会变成饺子,怎么变成饺子?那就是先把馒头变成面粉然后再加一点馅和调料,XML就是面粉,所以要把我们原来纸书期刊的内容变成面粉,因为时间关系看的是国外的数据库产品都是基于SML做的,大家看到国外很出名的Springlmages,它这个有数据库,这些东西这些产品都是把原来的期刊、图书碎片化之后然后抽取形成这样的知识库,这个知识库要比原来贵很多。然后还有这些国外的图书期刊数据库,所以我们可以看一下第一个建立碎片化的标准,所以在国外出版集团十几年前就已经把内容进行碎片化,把他们的内容变成非结构化的数据,它也有自己的标准,所以很早以前我们提出来有些行业的人提出来没有标准,那是因为不懂,在国外已经有很多出版集团建立了数字出版标准,而且国际上也有同样的标准体系。 [2015-03-27 15:56]

    [郑铁男]再看国外的同行的一些期刊、图书他们都变成了专业知识库,他们也都在手机上进行了服务,我们这个同行尤其出版很多人自杀了,大家也都知道不堪重负,一个是纸质的急遽下滑,跟互联网是有很大关系的,如果没有互联网他们可能不会自杀。第二个从结构化的数据到非结构化的数据。我们以前出版物出版的图书期刊其实都是一个产品,你拿到一本书要考试,拿到一本期刊跟下一个期刊之间的关联关系等等都已经做好了索引,其实它都是结构化的数据,有正文、作者、标题等等排序,然后有第一章、第二章、第三章,还有引文等等,其实完全是结构化的,它已经在编辑里面在编这个产品的时候已经形成了一个思维逻辑,所以它是一个结构化的事情。但是这样的产品如果我们做成电子书一样,那实际上已经不一定适合新的手机上的阅读方式,所以需要把这样的产品把它碎片化,变成一个非结构化的数据。所以,凡是不管是编辑出版这方面的学生,不管是研究生、本科生、博士生我觉得你们学点技术不一定要完全掌握技术。 [2015-03-27 15:54]

    [郑铁男]

    第一个就是互联网数字出版等于互联网,大家看到这些是我去年还是前年做的一个APP客户端的列表,你看见大家在手上拿手机去看查数据这个已经出位置,整个阅读也进行了分支,有社交、阅读、个性化服务的都会有,这样把这中间我创办的曾经有一个翻书网1.6个亿卖给百度了,现在已经不见了,这是行业也是变化非常快的。所以叫什么叫数字出版,看这几张图就知道了,出版加上互联网,所以就是数字出版。
     [2015-03-27 15:53]

    [郑铁男]第一个我在就任从学完之后,让我去从事互联网出版的时候,对于数字出版我们的行业还在讲双重PDF的时候我就提出来了数字出版等于互联网加出版。很荣幸,我正好跟着现在天天讲的互联网+,+什么,可能+到一块去了。所以我当时在做数字化转型的时候就把我们集团所有的期刊、图书都碎片化了,然后重新组织新的产品。第二个就是从结构化的数据到非结构化的数据,要把我们以前出版的图书、期刊这些结构化的产品变成非结构化的。第三个其实非结构化用一个检索郑铁男这个词就有价值吗?也不是。所以第三个还是要从非结构化、碎片化零散的数据要变成一个结构化的数据。这个国外很多出版集团都已经开始转型,转向了数字出版。它同时由出版商向信息服务商转型,第四个就讲一下数字出版人才的培养或者是叫大数据时代我们这样编辑、出版专业的学生你们以后培养成什么样的人才能找到工作。 [2015-03-27 15:51]

    [郑铁男]很多前面的专家讲的不太一样,我一直从事于数字出版和互联网行业,我从96年开始就接触互联网,然后组建过国家五大重点新闻网站,今天也很荣幸是央广传媒来做这个节目。你们的领导都是我以前的同事,所以后来我有兴趣转到出版行业,去做数字出版,我自己本身是学出版,有兴趣去读书,然后我们单位把我送出去的时候我还不太清楚,因为我一直做管技术、管金融做的挺好的,后来把我送到那去读书,在飞机场上下了飞机还没有到单位,领导就给我打电话说你不用中国网报道了,不用去搞互联网了,去做数字出版,集团要成立信息中心你去当一把手,所以我就被迫从看不起互联网的人就变成了出版人,变成了数字出版。我今天更多的是讲一些技术和盈利模式还有就是如何什么叫大数据,什么叫小数据,我觉得可能都不重要,最重要的是我们怎么去做产品。尤其是我们像河北大学这样的新闻出版学院这样的学生你们如何能变成一个产品经理,从这几个角度去讲可能会更好一些。这是我个人的观点。 [2015-03-27 15:50]

    [祝金甫]还有一个发行风险,我们最直接的形式是什么呢?电视剧播出之后我首先想到我和哪个电视台台长比较好,还有上千个屏幕你到底卖给谁,央视、卫视我们能否通过数据的形式,你题材适合的区域、受众比较喜欢接受的方式匹配和分析。数据化的形式。最终银行给企业贷款的话,它比较采取传统的方式抵押贷款,所以很多的传统金融机构丧失了很多机会,那是因为它对轻资产的制作和发行并没有进行风险把控。那么如果在生产过程当中,这个企业得事前事中事后进行整个的分析,然后就知道这个项目到底多少?这种情况不需要抵押贷款。我就不多说了,纸牌屋是用经典的大数据分析,剧本是预测和分析。还有一个通过大数据分析你知道小时代,喜欢小时代人群到底具备什么特点,能否根据这些特点受众人群再拍出类似的电视剧和影视剧。还有一个最终产业的繁荣肯定需要影视数据和金融,所有产业发展需要金融资本的支持,谢谢大家! [2015-03-27 15:49]

    [祝金甫]还有一个,通过收集数据的形式,我们把每一个数据进行分析,你这部电视剧的作品我能不能抒情的展示给你,谁喜欢播、什么地区的多大人喜欢看?曾经有一个卖方便面的老板找我去,我的方便面想卖给北京养生堂,到了北京养生堂收视率比较高,因为价格比较贵,我就问他一个问题,你这方便面让谁吃的,不可能本来深养生的给60岁以上看的还让他吃方便面,通过所有数据搜集发现,在18-24岁,34岁之间他们观看北京卫视的节目是军情解码,所以我们看到精准的数据分析对植入广告也是有价值。还有一个剧本的风险,所有的影视作品剧本都是我们能否利用深度学习的形式,把整个的影视作品进行深度分解。那么同类型题材我也拍一部谍战戏和美国和中国的相比较你有什么优势,你的题材、你的人物、你的结构、你的发展点到底有多大优势,能否用展现出来?还有一个你的人物的发展,是比较平坦的发展还是跌宕起伏的?我能否用数据的形式来表现出来?再一个,传递的优势。我拿到剧本的时候能否对将来电视剧的发展提供准确的预测。还有植入广告。还有明星,我们都知道中国的一部影视剧成本影星占了60%-70%,其实比较合理的方式是25%到30%,在中国是并不合理的。那是为什么呢?我们在选择影视的时候,能否进行价格档期,比如作品收视率,甚至这个人他和他的作品是不是相吻合?而很多情况下这个影星的价格往往是开拍前的价格,我本来拍部电视剧,别人说了,我非得让吴秀波来演,当然吴秀波演的戏适不适合他?都可以用数据来展示出来,现在之所以出现这个现象是因为劣币驱逐良币,信息不对称造成的。还有一个生产贡献,投资人最担心的是什么呢?我投资一部电视剧花了五千万,拍着拍着忽然钱没有了,那你是继续拍还是不拍?那么我能否对投资方式进行时实的监管,了解每一分钱和整个生产的进度,并且用数据可视化时实转给投资者和生产者。 [2015-03-27 15:48]

    [祝金甫]我们再看一下在新媒体时代观念已经变了,大家看一下最多的是通过笔记本,通过手机是22%,还有喜欢的电视剧类型是53%,职场偶像剧是34%,去年在春剧会上,整个参展是700部偶像剧,但是真正通过市场需求数据要达到34%的市场需求,而实际的供给量只有40%左右。大家都知道神雕峡侣翻来覆去的翻拍,还有故事情节,第三个是人生观。还有一个电视剧产业偏好,在新媒体最受欢迎的还是美剧,然后才是国产局,那么港据现在不像以前了,还有植入广告的,54%是在意,45%并不在意。也就是说你的植入比较好的话,别人可能也是能接受的。往往在一部电视剧里面明明是个富二代非要开一个破桑塔纳,那这样把整个的剧情都弄的不匹配、不合理了。 [2015-03-27 15:47]

    [祝金甫]那么上马一个项目之前能否用数据的形式了解你上马这个项目有多少,潜在的压力,生死线还有受众平台,假如我想拍一个谍战题材的电视剧,那么数据能告诉你,这个市场库存谍战有一百部,今年计划三十部,拍出来二十部,已经播出的十部谍战里面进入前五名的只有三部,如果你在向投资人说拍一部影视文化作品谍战题材的,前有堵截,后有追兵,你到底投不投拍?即使你投拍谍战题材的话,那么你与其他相比较,你是投资多,剧目优势还是导演优势。如果把所有的数据整合在一起并且能够表达出来这个时候对投资者的风险是能表达出来。这是第一点市场风险。 [2015-03-27 15:45]

    [祝金甫]第一个,有没有整合数据的能力,垂直纵深。还有一个,有没有挖掘数据的能力。我们看一下影视文化作品来说,之所以现在数据量非常大,我们始终喊着大数据时代,2013年大数据元年,2012年美国把大数据作为国家战略计划,那是随着硬件和软件的发展,人在手机包括PC终端,在网络的痕迹存储也成为一个大数据。当然85%是非结构化数据,并没有处理,视频、文字并不容易处理。15%是结果化数据,这就不多说了,体量大、价格大,这是比较官方的说法。还有一个,现在近几年的数据量90%是近几年产生的,也就是软件和硬件的发展。在2020年,整个数据量达到35G级,这是什么意思呢?就是3500万个亿这个G,就特别特别大就是和地球的沙子数量差不多。还有说了,数据光大没用,要进行。第一个是啤酒加尿布的故事,还有一个是塔吉特怀孕少女的事件。因为塔吉特是美国的一个超市,忽然有一天,一个中年男子闯进了超市,向超市的经理大吼大叫,说为什么往家庭里不停的寄送怀孕少女需要的物品。当时这个超市忙于道歉,回去之后进行分析,他对每一个超市的顾客进行综合分析,他发现这个顾客喝的全是怀孕妇女买的物品是相关的,所以不停往这个家庭里面寄送怀孕少女的东西,后来他的父亲来超市道歉,因为他的女儿确实怀孕了。也就是说,超市比这个少女的父亲更早知道这个少女怀孕了,这因为什么呢?数据的挖掘。第一个,塔吉特超市可以挖掘数据进行分析,所以数据光大没用,一定要进行挖掘分析。那么对影视作品来说,我们能否从全产业链的角度,来整合每一个环节的数据,然后进行分析和挖掘。那么第一个,我们在做一个影视作品的时候,首先分析一个市场风险,因为每一个制片人,他在投资或者销售自己作品的时候,都说自己的作品是最好的。就像每一个家长一样,都说自己的孩子是最漂亮的,每一个家长都是这样的,但是能否用数据的形式来策划你的孩子到底长得漂亮还是丑。 [2015-03-27 15:43]

    [祝金甫]最近影视剧蓬勃发展,很多卖烟花的、卖猪肉的,包括卖石头的全都进了这个行业。当然中国的影视剧跟美国好莱坞相比较差别非常大,之所以差别这么大,是去年的影视收入是296亿。但是为什么差别这么大呢?是因为资本或者一个影视文化没有很好的结合,就是影视文化属于轻资产,它是一个特点,但不是弱点。之所以大规模的资本不能进入这一个市场,那是因为什么呢?轻资产存在着一个风险评估的问题,总而言之就是一个版权定价的问题。因为它的文化艺术是感性的东西,它和其他的东西像实物房子它是看得见、摸得着的,它是可以定价分析的。我们今天讲一下,我们能不能从数据的角度,把文艺的东西,能否用数据化表示出来,来进行定价。我们大数据的时代,不是说数据越大越好,看数据有没有价值,不在于大而在于有没有价值。所以对一个大企业公司来讲,一个数据公司有几个特点。 [2015-03-27 15:41]

    []还有一个信息网络传播权的保护条例里面实际对这个数字教材教辅的版权保护还是不到位的,还是有一些地方,有的地方明显钻了空,我就反复剪多段视频,每段视频我都加评论,所以说用各种方式来避开版权这种资源形式的缺陷。消极的一面一方面被传播容易侵权。另外还因为多媒体的作品制作带来许多困扰,就是说海量作品的版权的追踪,报酬的支付这些问题,这个里面网络版权的论纲里面分析的我感觉是挺好的。数字教学的应用,还插入多种媒体的场景。电子教材加工以教材为核心进行资源组织的过程可能也会造成侵权,重新处理这些资源。那么我们如何应对大数据背景下教材的版权问题,一个是完善法律法规,二是配套相应的数字数据的,登记版权归属。第三也是上海虹口进行电子书包实验的时候建立统一的资源鉴定平台,资源版权建立的平台。第四是利用大数据技术及时预测技术来进行防止侵权行为。谢谢大家 [2015-03-27 15:39]

    [李林]大数据刚才各位教授讲的很深入也非常好非常精采。大数据在很多人的眼里可能首先感觉这是个技术,这是一个积累记录,然后有这个定义是资产,环境大数据的环境,还有它是一个处理速度非常快。还有一个是过程方法和手段,处理数据的方法手段。那么大数据的版权有什么影响?一方面它有积极的一面,通过数据的分析、积累、挖掘、有利于教学和学习进行个性化、精准化、精确化的教学支持、学习支持的一块。另外也可以根据学生的比如说小学一年级到小学六年级它的学习过程出现了问题。然后随时的诊断反馈,也可以在他快要毕业复习之前给他出一本书个性化的教辅特别是高中到他毕业之前快要考试的一两个月针对他自己的个性化教辅。 [2015-03-27 15:37]

    [李林]上面五种处理方式。这是上海市的数字发行以及管理平台。这是对北京中小学教学资源网学习客户端,它是云端的数字教辅的延伸资源的版权问题数字教辅资源的版权问题分为数字教辅教材延伸内容资源的版权问题,首先是数字教材教辅的版权问题,数字教辅与纸质教辅的教材都是从辅助教材版权延伸而来,一般情况下本版的数字教材是代表自家辅助教材的版权提供,但是民营机构出的教辅就容易与教材的出版社之间产生纠纷。这个问题主要在哪呢?主要在教材的独创性的结构,任教授的语文和苏教授的语文签订的目录,各种情况齐全,就是它的独创内容。还有一个就是说我们常满的教学讲解是直接用那个内容这是侵权的,像同步教辅是用了教材的体系结构造成侵权的,还有用教材里面有原创的内容有非原创的内容,有公版的内容是没有什么事情的。就是非原创内容但是不在出版了,那这个也是有问题的,教材本身原创的内容也是容易造成侵权的。这个有时候开发的数字教辅的开发机构也是采取定制的模式,提供服务避开版权。其次是数字教材延伸内容资源的版权问题,这些延伸的资源包括图片、音频、视频动画、这些内容也可以分为独创性内容,和公版内容这一方面分别处理。还有再次数字教材配套应用软件的,我做的是软件,软件的数据库能潜入到别人教材的体制结构这也是有问题的。 [2015-03-27 15:35]

    [李林]第二种情况就是版权问题,民营数字教材开发机构开发基础教育出版社书教材的版权解决方式就有以下五种解决方式:一是直接与出版社签订数字化的授权,像民国教育等,例如宁波签订了30多家基础教育教材的数字化的版权。第二点是通过与基础教育教材出版社合作产品共同采取的版权,约定相应的利益分享方式。三是承担基础教育教材出版社的出品无偿开发,然后出版社默认开发者获得该产品的复制权包括延伸资源进行市场销售,四是由数字教材加工工具及承载系统但不具有数字版权的数字出版公司,学校及教育局提供加工定制服务的名义,帮助学校及教育加工上传数字教材,实际上这也是有问题的。第五个数字出版公司为具有数字版权的机构提供数字教材的加工机制流程标准制定与管控服务,帮助组织开发数字教材发行平台,数字教材的资源平台及客户端,数字教材内容管理平台并提供相应的运营服务。这一块我们在做整个上海市的和北京市的电子教材服务这一块。 [2015-03-27 15:34]

    [李林]数字教材的授权这一块它的解决方式。因为现在数字教材从2010年左右开始掀起制定电子课本数字教材的标准,到上海、北京都在北京市开发电子教材,它的这个版权的解决形式依然是一种一体化的形式,就是它的数字教材和纸质教材出版都是一个机构,本身它是不存在版权问题的。二是基础教育出版社数字教材的版权自然归属,比如说上海的整个基础教育教材就是上海市教委他出的数字教材不牵扯版权问题。然后像北京京版教材现在2011年审定的叫新京版教材,它的版权规北京教育科学院所有,所以这里面开发数字教材也不会遇到版权问题。 [2015-03-27 15:32]

    [李林]在这样一个格局下,进入数字教材,数字教辅的发展比较快的时期,跟在线教育的未来也是紧密相承的。版权配套的教辅一开始2010年出版总署对教辅的定价是非常高的,现在定本版教辅价格已经限制它了,但是走市场化的教辅这个价格限制还是不大的。这样就是说教辅出版机构往往有的是出版社本身,有的不是出版社本身。那是出版社它出版自己教材的教辅和别人出版他的教辅就冲了市场,这样首先以一家民营的教材出版社,他来保护自己的版权,教材的版权是用了非常强烈的手段来保护,由它来引起了整个基础教育出版社教材要求加工他的教辅,后来包括数字教辅,有教材的授权。 [2015-03-27 15:31]

    [李林]在我们这个新媒体互联网的迅速发展这种背景下,教材教辅的呈现形式、传播形式更加复杂化,版权的保护的复杂性就大大增加。首先我们看基础教育的纸制教材的。2000年前基础教材主要是上海和北京有自己的教材,2000年之后,2001年新教材标准实行之后教材是一标多本,就一个课程标准,一部课程标准多个教育出版社都可以出教材,是这样的一个情况。然后上海属于一个特别独立实验区,它有自己的课程标准,就是独立于教育部的标准。它的教材体系相对的比较封闭,北京当时也有自己的21世纪的实验教材,也有一套自己的实验教材,但是他也用别人的教材,但是上海是不用外地的教材的,就是在十多年的实践里。就是这两个直辖市形成了封闭和半封闭的教材体系,整个的教材在新课标里面形成三级教材,国家地方校本教材。  [2015-03-27 15:30]

    [李林]感谢伍总,感谢陶教授的邀请。我介绍这个大数据不像咱们教授说的那么严谨,可能是融入、氛围、场景最综合性的东西,最主要是对基础教材的思考这一块。国际电子教材发展进入了这样的几个阶段,标准的分布阶段,盈利到信息化的阶段,早期市场阶段,实验阶段。我们可以给他分为三类的国家和地区发展的情况,第一类国家和地区美国和韩国发展的比较早,然后欧盟、新加坡、日本、第三类国家地区就是以色列和中国。这个是一个大的背景,然后我们看我们中国的基础教育教材市场的份额,教材有狭义和广义两个含义。一个是讲我们手里拿的最基本的教科书,如果把这些教材教辅都归纳到里面是广义的范畴。在我们国内基础教育教材教辅这一系列占我们整个的出版文化产值的2/3左右,教辅教材版权问题是在2001年之后这一块越来越激烈,版权的纷争方面。最主要的是教材教辅巨大的利益,因为教材本身它有法律的指导意见,中小学的教材,狭义教科书比较低,教辅可以高定价,这样它的利润空间就比较大。 [2015-03-27 15:28]

    [杨再石]下面再讲就是现在大数据比如说十万张图,四个大毛,10万张图由计算机学习,计算机归纳出这个图,因此猫的概念是计算机自动生成的,我想这个大数据时代的想法的变化。最后,我想我讲每个人都可以用计算机来分析你的照片和分析你的视频。这是我分析我自己的让计算机来分析分析出来之后英文我翻译成中文,首先说我是个男人,第二这是个肖像,第三是男子汉,下面一层就讲是个男孩、牛仔,戴帽子我没有戴帽子风吹起来了。第四层是个孩子,最后说一个人来,所以分析是完全正确,这个大家完全可以做。第二还可以做视频。这个是我自己的一段讲的超导体,这个是悬浮,现在可以悬挂,这个不演了,然后我让计算机分析出来以后,每一秒钟这个里头内容的大概什么都可以推算出来,已经到这个水平。而且这两件事情我们在场每个人都可以用。因此,我感觉到今天大数据不是不接地气的,是我们完全可以去用,我的发言完了。 [2015-03-27 15:27]

    [杨再石]第二个,要简单一点,时间关系。第二,因为有了这样,我们计算机今天已经达到通过计算机来识别图像,而且造出来,那么我想举这个例子,这个是一个图片。它是用了深度神经网络这个神经网络进行分析,神经网络在分析的时候是自我学习,一共学习9层,什么学习我今天不能讲了。学完了以后它提炼出了概念,用适量来表示。然后这个适量代码输给了语音生成的网络,他就把这个适量转成文字,因此我们看到计算机分析这个图片里面一群人在露天市场购物。第二句话在果蔬摊上有许多水果这个完全正确,我想已经达到这个水平了。 [2015-03-27 15:25]

    [杨再石]我讲的大数据第一个概念大数据是数字能源,因为对火箭来讲燃光有燃料是不能起飞的,必须有发动机,因此大数据的第二概念必须由算法,如果没有算法我们没用的。第二大数据要扁平化,每个人都要用,大数据是用出来的,而不是我们想出来或者搜集出来的。那么我想,我为了参加这个会我准备了一个可以讲40、50分钟的内容。我先讲一个最简单的一个东西,大数据刚才讲了一个是全数据,不能是抽样,抽样是人工干预客观数据,属于我们许多作假就可以在抽样里面作假。那么第二个概念,我想我简单一点,我想讲相关性。我们不讲逻辑,首先讲大数据时代的相关性。什么是相关性呢?我给大家大数据相关性,就是国王和王后。K是国王,M是男人,F是女人,Q是女王。那这个相关性是什么意思呢?我们看国王,全世界人都认为他是这个国家的男人,那么国王减去男人,剩下来的就是正国级的人。那么正国级的人加上女人就等于正国级的女人,因此最后正国级的女人就是王后,因此我们说的关系式就是国王减去男人加上女人等于王后,这是我们大数据时代,用到语言翻译的时候,是一个基本的假设。就是刚才我讲的这个关系,对世界各国来讲,一看就明白,不需要用语言去解释,因此语言翻译就可以用个适量来表示,这是第一个。 [2015-03-27 15:24]

    [陶丹]咱们这个叫大数据的版权管理,我们这四位专家所发言的内容都跟应该来说跟版权还是有相关性的,据我所知咱们李林专家好像就是做教材版权经营吧?一方面是教材版权,还利用教材版权来进行经营活动,所以这个是更高形式的版权。那我们郑铁男先生做的数字出版达到了很高的技术水平,我知道的杨再石教授一会儿要演示,刚才我们说了大数据看不见,一会儿杨教授计算机里面的就是一个大数据的网,用的是大数据的软件,他展示的就是一个大数据,大家看看他是怎么样在用大数据。还有我们祝金甫先生。杨先圣先讲。看看他怎么样运用大数据。 [2015-03-27 15:22]

    [主持人]感谢王教授,非常感染人心的一段报告。那也感谢其他两位专家的精采分享,下面我们进入到论坛讨论的环节,我们首先有请河北大学新闻传播学院教授、博士生导师 陶丹主持"大数据时代的版权管理"论坛。嘉宾有中文在线副总经理李林、高等教育出版社原副总编辑杨再石、北京工商大学副教授祝金甫、北京(山东)斯麦尓数字出版技术有限公司董事长郑铁男。有请各位! [2015-03-27 15:20]

    [王立新]所以,做风投的人,做金融的人对这个很感兴趣。有两个工具我觉得很重要,第一个当然是业内的非跨界的比如说中国移动曾经让我操盘过一个应用。最后讲一个故事,如果我是张瑞敏,怎么改变海尔冰箱利用大数据赚钱,所以那一台冰箱生产成本1200元人民币,最后的利润只有38人民币,如果用大数据赚钱我的口号第一句话海尔冰箱不要钱白送,第二句话在海尔冰箱里面加两个功能,第一个加信息扫描系统扫二维码,第二把这个路由器装在冰箱里发送到海尔的云数据库,永远不赚消费者的钱,冰箱买走。第二句话,你要买东西不要去商场直接给我打电话有人给你送。第三价钱便宜一半。第四冰箱里面的食品过去了,永远免费提供预报、信息化受众。只要落到这四条所有的家庭主妇都愿意接受这个。而这时候你可以采集大数据,这里面家人买了什么食品、牛奶放在里面喝掉多少,耗掉多少都知道,所以掌控了这个需求就很高兴,通知汇源果汁、通知可口可乐、通知青岛啤酒,然后打压他们的生产成本。这样的话假设一个家庭一个月用两千块钱的放在冰箱里只赚10%就是200,6个月收回冰箱的制造成本。10年可以赚15000多元纯利润,你是卖冰箱的38元的纯利润还是想在未来十年赚到一万到两万的纯利润呢?就是采集数据、精准匹配、拼公司、平台化反向收费永远代表用户的利益,免费,谢谢大家! [2015-03-27 15:18]

    [王立新]把吃喝拉撒睡全赚了,这就是BAT模式,看到了吧。一群人分析他的全数据让王立新玩游戏、买淘宝、看新闻、所有的需求玩迪斯尼,看迪斯尼,旅游迪斯尼,总而言之就是要赚你的钱,第二就是输入汽车两个字就可以看到12亿人、13亿人最近有哪些在谈论点击或提到过汽车,这就是大数据垂直的模式。第二个功能是什么?永远只赚一种需求的钱,但是是满足所有人。如果我建立一个汽车数据库,我就能赚汽车行业的钱,这叫垂直的满足所有人。第三个是什么?IPO孵化,通过大数据来风险精准投资,孵化应用,去上市骗股民的钱。 [2015-03-27 15:16]

    [王立新]所以,大数据正在成为未来媒体的最核心的最有价值的内容本身,第二大数据本身又帮助媒体去实现私人定制。所以我特别想去注册私人定制。冯小刚拍一个电影最后被工商局驳回。第二个问题就是大数据的平台应该怎么样,第一个实现功能,第一个是输入对象的IP地址和省份,姓名或者电话号码就能看到这个人最近几个月到底浏览过什么?这叫基于个体全数据分析的运营。输入王立新,王立新过去三个月当中所有吃喝拉撒睡,所有的信息都能看到,这样的功能的结局是什么?永远赚王立新所有的钱这就是第一个商业模式。 [2015-03-27 15:14]

    [王立新]第三个什么叫新媒体,数字化、互动化这些我觉得都是表象,新媒体我用一个词来把它概括叫个媒体时代,新媒体的本质是个媒体,两个方面定义,每一件被智慧化、被芯片化的物体和人都成为一个独立的媒体而融入物联网、云计算和移动互联网。包括媒体浏览、每一辆车、每一个井盖你给他加了RFID的芯片它就是一个自媒体,所以媒体在不断的向世界发售他的信息为容,这些内容对很多人是极其有利的。比如说我们的井盖公共设施经常被人半夜偷掉,如果这个井盖被智慧化、芯片化之后只要有人动它那就发出一条信息,我是长安街7号井盖,正在被人往西南方向移动。所以相关的警察和市政部门就会向西南方向挺进。反过来,你们家的酸奶,比如王立新家的孙奶是有生产和保质期的。王立新在这儿讲的热闹,手机响了,"主人,别讲了,我是你们家的第四号酸奶,再过俩小时你不喝掉就过保质期了。"所以从战略意义上来讲所有的媒体都会被物化,从这个意义上来讲媒体的新概念,第二个是媒体的消费一定是按需的。比如说王立新喜欢看什么?所以以后一个大的业务是什么?除了新浪、微博、微信的自媒体,还有就是品牌。习大大的媒体关注,习近平同志最近几天他浏览过的新闻信息排行榜是什么?各个省委书记一定愿意花大价钱来看这个排行榜,王立新最近看什么不值钱,习主席在看什么值钱。 [2015-03-27 15:11]

    [王立新]但是供过于求造成经济危机的浪费,所以在1945年芝加哥两个研究生利用两位大师的论文终于制造出了人类第一台计算机。据说当时老总听他儿子说这个事情的时候,说这么庞大的笨重的一个东西全世界总共能卖7台就不错了,所以到2010年为止全世界一共卖出了41、42台计算机,当时只有7台。所以计算机的出现是信息超越土地和石油成为人类第三次文明最核心的资源。所以在工业文明时代,在今天谁掌控信息谁获得主宰世界的权力。所以争夺数据成为根本的竞争,所以美国在十几年前就已经把互联网数据信息列为美国的国家主权来捍卫,这是继土地、领海领空过后第四大主权领域,国家主权。所以美国建立了自己的网络作战部队,所以从战略意义上来讲现在我的很多学生,社会上那些人都请我做创业导师和顾问,上来我只问他们一句话,无论你做什么业务、什么行业都不重要,只问一句话,你这个业务能采集到数据吗?能存储和运营数据吗?如果不是,一定是个小生意。一定是一个小的生意,成不太大的平台数据,所以讲了这么多,告诉大家,数据一定是什么?以个体为核心的运营。至于后面前面几个教授都讲的很好,多样性、结构化数据、非结构化数据,时实的,这些我觉得都是成立的。但是条件是什么?以个体为核心的领域。 [2015-03-27 15:09]

    [王立新]第二瓦特发明了蒸汽机,蒸汽机的本质就是发动机,发动机经历了煤炭、蒸汽、电力、核能,所以发动机技术的出现就是要解放人的体力,把人类的核心的财富从鼓励转向土地下面的东西,土地下面的东西是什么?矿产资源,煤炭、天然气、石油、铜矿、铁矿、汞矿,澳大利亚靠什么铁矿石。所以,鄂尔多斯靠什么?煤炭,露天煤炭。所以有了发动机技术使人类终于进入了大规模、标准化供过于求的丰饶的物质文明的时代。  [2015-03-27 15:08]

    [王立新]所以,人类所有的进步归根到底就是交易成本的降低,而交易成本的降低取决于信息的对称,低成本、而信息的对称能够解决供需双方的按需生产,按需采购、按需服务。所以从这个意义上来讲我们这一代是非常幸运的一代。出生在綦江县。我在7、8岁的时候没有看到过火车、没有自来水,是一个实实在在的农业文明,在我14岁的时候考进了重庆一中,到了重庆沙坪坝,17岁的时候考进了上海华东师范大学灯火酒绿,我终于看到了工业文明。紧接着我21岁分配到北京邮电大学中国信息产业的IT黄埔军校,终于知道了什么叫信息,并且有幸成为这个领域的一个抛砖引玉的研究者。所以地球有46亿年历史,人类有300万年历史,人类文明只有九千年历史,而王立新只用了不到40年的时间历经了人的三大问题。我是空前绝后的一代。以后的人直接从工业文明滑向这里。所以三个文明最重要的不同是什么?财富标准的转化,农业文明是因为发明了炼铁技术,使土地成为人们最最核心的资产,所以最有钱的人叫地主。争夺土地是农业文明的根本特征。 [2015-03-27 15:06]

    [王立新]最终导致的是谁来采集到全数据,谁就为王,谁就可以虚拟运营和掌控这个世界,所以从这个意义上来讲人类只有三个最基本的问题。第一是能量转化关系这是科学家研究的问题,宇宙大爆炸能量高、能量低最后直到宇宙能量的平衡使其生光电热生物转化这是科学家要解决的问题,能量的转化问题,第二个问题是供需关系。第三个是信息共存问题。所以我认为信息化最最重要的是能够通过IT技术的进步使供需双方的信息实现成本接近于零的精准智能化匹配,从而把人类带入自时代的经济计划时代。所以你要让我耸人听闻的说今天的标题可以成为马克思的计划经济终于在云计算移动互联网时代看到了实现的希望的曙光。 [2015-03-27 15:04]

    [王立新]第三个问题大数据的出现对整个人类社会的各个领域和方向会产生什么本质的颠覆,有什么影响?我去看病有什么影响,我要读书、学习有什么影响,我生产汽车有什么影响,这种影响是颠覆性的。最后一个大数据到底终极目的要干什么?我提出了四个问题!我没有从别人那里找到答案,后来我就自己来想这个答案,其实蛮搞笑的,学的是哲学,学的马列主义哲学专业。这个月刚刚出版了一个叫甜蜜与痛苦;第三我从来不会上网也不会打字,直到有了智能手机,因为什么五笔四型、拼音什么都不会,后来88年我就分到邮电大学,所以分到那了受到生活所迫的压力,所以成为北京邮电大学第一批IBM和EMBA电子商务商业研究的人员。所以对我而言,我回答的第一个问题是,大数据跟自时代是一脉相承的,所谓的大数据的本质是什么?人类终于通过云计算传感网、宽带、存储通过这样的信息科技的累计的突破终于可以一只猫、一个婴儿、一个井盖、一辆汽车甚至一座山的环境数据提供全数据的采集。如果每一个个体的物体人和动物都要提供一个单独的全数据库的采集,那体现出来的数据当然是什么?特别特别的多,特别特别的大,它的灵魂是什么?以一个个体为单位,你可以为你们的家的宠物、一只猫、一个狗、生下来的婴儿、为冰箱、汽车提供传感器全数据的采集,然后来运营这样的数据趋利避害,最终的目的是要实现什么以个体为单位的全信息服务。 [2015-03-27 15:02]

    [王立新]第三个制造,用智慧的方式实现自我创造,自我实现,所以自我、自由、自主、制造。这就是自时代对所有行业的影响。这是我想说的第一个概念什么叫移动互联网的本质自时代。第二个就叫大数据,基本上就是数据特别大,所以我经常开玩笑对这些专家说,到底一个GB是不是大数据,那么一个TB叫不叫大数据,TB不是,那么一个GB、YB到底从量变到质变要多大的数据量称之为大数据。数据的挖掘与应用早在人类文明诞生开始一直被应用,从抽样调查使用的时候用的就更多了。这些都在做数据挖掘,那么到了今天难道你能告诉我大数据跟传统的数据挖掘有何本质? [2015-03-27 15:01]

    [王立新]第二个讲一讲关于大数据的运营、应用、到底有什么工具和思路,这是我比较关心的。我把我自己的一些见解供大家参考。最后第三点我更关心的是大数据怎么让我们赚钱?怎么创造社会价值的同时能够创造商业价值。所以主要就这三个问题。第一个问题叫做自时代的到来,自己的自,什么叫自时代到来,移动互联网并不是它的本质,并不是当时摩根斯坦利那个著名的报告。摩根斯坦利在四年前写了一个报告,什么叫移动互联网的本质特征,算了吧,社交、社区、未知服务,最后叫移动化。所以这个被全球各界视为移动互联网最权威、本质的解释。后来在2012年IBM有一个影响力论坛。他们不知道从那里了解到我对移动互联网有一些自己的看法,所以请我做主讲嘉宾,后来我第一次在2012年万豪酒店影响力论坛上IT就是Information Technology,但是到了云计算、物联网和移动互联网时代我们人正在进入一个自时代,自时代就是8个字,以自我为核心、无服务对象、结构只属于你的需求的服务解决方案。第二个叫做以自由为终极目标。自由;第三个叫以自主选择、自主权还给个体,还给个体不仅仅是人,也包括动物,也包括所有的智能化的物体,要由他来做出自主的选择,自主的消费。 [2015-03-27 14:57]

    [王立新]非常高兴,我也没有PPT,因为我是比较崇尚低碳。我也先给大家做一个我自己的广告,我所有讲的观点以及中间材料的搜集和论证都在去年出的一本书叫《一部手机打天下》你们在京东上可以买到。我主要讲三个问题:第一个问题我们今天讨论的主题是新媒介与大数据,首先什么叫新媒介,什么叫大数据,什么叫移动互联网?什么叫信息文明。这些东西我觉得没有一个权威的定义。实际上就形成了一个什么新瓶子装老酒,能够搞样板抽样的人也把自己包装成大数据放到那个股市上去,资本上翻多少倍,所以我觉得第一个我要谈谈我个人对今天的基本核心概念的理解,当然这是一己之见。 [2015-03-27 14:56]

    [主持人]感谢匡教授。下面有请北京邮电大学教授王立新,作题为《大数据时代的精准营销》的报告。  [2015-03-27 14:55]

    [匡文波]目前我们看到的所有对策其实都存在一定的局限性,比如说我们立法,而且我们国家其实对隐私权的保护从国家层面来讲并不是十分重视,比方说我们国家的宪法里面并没有规定要保护个人隐私,我们国内的隐私权的保护条款是分散在民法的几个法律之中。我们能不能治理一个个人隐私保护法,在西方国家出现一种趋势,确立隐私的等级保护,我把隐私分为很多等级,有的等级隐私不允许使用的。但是这有一个问题且不说立法能不能实现,即使是立法实现的话通过法律的手段去维护个人隐私的成本也是非常高的。我不可能说我的位置信息被暴露了,我去起诉腾讯,或者我起诉陌陌什么软件,这个代价成本抬高了。而且还有一个问题,比如说法律这方面如果成本太高的话,我能不能加密?但是问题是你不可能对所有的事情进行加密,这个是做不到的,这样太不方便了。所以事实上,很多做密码研究的专家跟我说,其实密码设置了多么复杂,多少位六位八位十位,其实价值不是特别的大,因为很多时候你的密码对于服务商来说是可见的。比如说你登录微信,你的密码可以做得很死的。但是对于系统来讲这是可信的,你设置个邮箱,登录淘宝,但是这个密码完全是透明的。还有说我道德自律,这是很软的东西,我很难想象会被小米或者一些商业公司要求它自律。还有就是对隐私的保护,关键在三个平衡三方的平衡,个人企业和政策的平衡。那么从政策层面来讲,我们要实现对互联网的监管,应该是建立在尊重个人隐私的前提之下,而不是破坏这样的隐私,这是一个政府的权利的约束,斯诺登事件之所以在西方世界引起哗然,也算政府跟个人的权利相互交互的,还有商业利益,个人利益、商业利益、政府利益三方的平衡,地还有一个问题,在中国特殊的原因,比如说什么原因,保护文化的文化传统,即使你来了,西方国家提出来实际上从1998年提出来的,虽然说实践并不是太强。而我们国家历史上由于种种原因,从文化氛围来讲并不是很重视个人的隐私,所以我们要进行舆论管理,就是要舆论监管,谈了很多,待会儿我们会谈,这方面是比较欠缺的,或者说比较薄弱的,一个受网络版权的保护,我个人认为完全是一种版权的行为。因为百度文库是一种商业性的,你看百度文库里面下载资料是要付费的。比如我的大量的书、我的论文都在百度文库里面,百度文库给我们提供资料,这个也提出过,版权的保护在我们国家是非常薄弱的。另外还有一点就是说隐私的保护,这个并没有提升到政治层面上,仅仅是从法律层面来上讲,这里面有文化的原因,这个文化的原因提出了这么一个问题,比如说我们现在还没有到达一个圆满的答案,给大家提供一个参考,谢谢大家! [2015-03-27 14:51]

    [匡文波]还有一个最可怕的是什么呢?手机暴露用户的位置信息,做营销的,做广告是最高兴的。因为手机能暴露你的位置信息,我记得02年在日本的时候发现一个很有趣的现象,十几年前日本的广告就已经做的很发达了。如果说你经过一个购物中心,这个购物中心促销的信息会发送到你手机上,这个是一个位置信息。位置信息有可能有点吓人。国外有人说如果一个超市超过5公里以外你肯定不会光顾,位置的信息还有宾馆的信息。这个从好的方面来讲,用户信息、位置信息可以做广告,可以做营销。但是暴露你的行踪恐怕不是一个好事,虽然有人说我是个良民,我不在乎,但是恐怕你也不希望你的位置信息时刻被人掌握。现在问题在什么地方呢?不光是移动运营商随时掌握你个人记录,不仅仅是腾讯,一直用QQ,同样腾讯能够准确的把握你的位置信息,因为你发了微信、发了QQ,使用任何一款手机APP都能知道你的位置信息。位置信息有多重要,当然我不说国家安全,96年4月28号应该做什么样,应该来说影响比较大的,当时一个特大因素就是打手机,然后被手机所消灭。很简单,他手机报告了位置,紧接着找到他就把他消灭。而且现在一个问题就是说 别说腾讯,现在实名的手机比较多,马上查到这位同志比如说王老师在会场做报告,是个良民,我可不可以查一下昨晚是在哪过夜的?还有的说我是良民,这种信息恐怕你还不知道。而且手机里面还有一个问题就是说,有的手机里面的电池是不可拆卸的,这就存在更大的安全隐患。因为你不想被定位,你只有一个办法,把手机的电池拿掉。但是如果电池取出来以后人家是不能给你定位。如果电池还留在手机里面还不能给你定位。但是你用的是苹果手机,现在越来越多手机电池都是不可拆卸,华为、苹果、苹果是带头的,这样就能时实被定位,这是一个很大的安全隐患。 [2015-03-27 14:43]

    [匡文波]而且前面说到手机,它实际上是一个电网,它不是电话。所以我预期说,未来的十年左右目前我们所熟悉计算机的形态包括台式机、笔记本,包括平板电脑都会被淘汰掉,因为跟大屏幕的手机相比优势并不明显。所以手机是一个电脑,迷你型的电脑。而且智能手机未来还有一个希望,是一个很虚拟的器官,我们从麦克罗汉有一句很有名的话,就是“媒体是人类的延伸”。过去是做不到,到了手机媒体时代我们可以发现其实手机就是一个延伸,感知器官的延伸,而且甚至于手机比人的很多器官研究。有一天你觉得肚子不舒服,阑尾炎,你切阑尾吧。我相信切掉阑尾并不影响正常的生活。但是拿掉你的手机恐怕你很难想象你的生活会是什么样子。我们都无法想象过去没有手机的年代是个什么年代。那么这个是人的一种器官,而且有人开玩笑说手机是最大的小三,有很多网民最后睡觉看的是手机,而不是配偶。睁开眼睛看的第一眼不是配偶,而是手机。所以说手机的作用就不一样,正因为它的贴身,就发现手机不光是一个偷拍的神器,现在几乎所有互联网上偷拍的信息毫无意外都是用手机拍的。在座的各位我发现现在没有一位嘉宾是拿卡片式相机过来的,就都是拿手机。如果你想追求一个比较好的画面,你可以已经消失了。 [2015-03-27 14:35]

    [匡文波]而且我要强调一点,我们现在进入了无线互联网时代,手机是一个智能终端。现在最近二十年来,整个传播以后,整个传媒业出现了两轮的替代。第一轮替代就是94年到14年,这个替代就是电脑屏幕对电视机屏幕的替代,大量的数据可以显示按农村来讲每家每户的电视剧的拥有面和提高,但是电视剧的时间电视屏幕让给了电脑屏幕。现在出现了第二轮的屏幕替代,就是手机屏幕替代电脑屏幕,如果说像我们平时不备课,不写论文的时候其实很多时候都不需要把电脑打开,因为手机都能满足你的需求。而且我感觉再过十年左右计算机作为显示器、键盘这样的电脑形态会被淘汰掉。因为各种各样的智能终端是电网,所以手机观念是随身携带的,我做过一个问卷调查,如果你出门的时候忘了带手机怎么办?96%的人会说立刻回家拿,未来的几年,三到五年最有潜力的市场应该是智能手表,因为基本上手机这么重要为什么不把它戴在手腕上呢?这是一个最有投资潜力的就是智能手表领域。当然目前来讲我们作为手机来讲作为隐私保护来讲最危险不过的终端大家知道去年夏天小米事件,其实不光小米这样,苹果也一样,几乎可以说所有的手机企业包括酷派都在做同样的事情,只是程度大小不同而已。 [2015-03-27 14:31]

    [匡文波]大数据有很多优势,我们说大数据分析预测分析个性化分析,但是问题在什么地方呢?做了那么多分析和挑战,会有四个方面的隐私,同样也四个方面的挑战。第一个窥视,就是监视,很多数据其实是我们不希望别人知道的。这个数据比如说包括你看病的记录,包括你的上淘宝网上买的很多东西,其实你是不希望别人知道的。但是这都属于个人隐私。第二个是目前遇到的最多类型的,未经许可的上午利用包括营销,很不幸世界各国的法律都没有一个法律明确规定说要得到受众的允许才能够利用。还有结构,比如说随着技术的进步,那个基因信息是被测量的,可以被记录的。个人的健康信息包括你的一些购物的行为。会给用户造成一定的歧视性的待遇。还有我们见的最多恶意的使用,前面的使用应该是未经允许,使用还未必是恶意的。比如说个人信息的泄露,比如说买一辆车,买一套房,会有物公司,包括4S店,这已经把把你的信息全卖走,所以很多人都有体会,每年到你的汽车需要买保险的时候,就会有保险公司给你打电话,你刚买一个房子下来就有很多装修公司给你打电话,这个数字在哪个环境泄露,不言而喻。如果说这样的数据未经允许的商业使用还让你很心烦的话,接到过很多诈骗电话。连我个人的汽车的车牌号、型号非常清晰,购买的价格、随后有退税等等,我想在座的很多嘉宾都收到过类似的信息等等很多。 [2015-03-27 14:29]

    [匡文波]各位嘉宾大家下午好,刚才前面周老师已经提过了,就是说现在是最好的时代,同时也是最坏的时代。我这里给大家泼点冷水,大数据时代别不像人们想象的那么全部都是一片光明的,也存在很多问题。其实个人隐私的问题没有还没有找到很好的办法解决。大数据本身是个双刃剑,最近网上流传着一个笑话,有人在网上订个披萨,根据他所打的电话,我们很多都是智能手机,手机跟个人是一一对应的,然后查信用卡记录,然后通过信用卡记录然后查到他的社会安全保障号,到图书馆借用哪些书等等,他个人的私生活全部一览无遗。前面会提到精准营销,事实上我们拿了用户的数据之后进行精准营销是没有得到对方允许的,是未经许可的。这是一个很大的问题,而且我们上网的时候我们拿着手机,只要我们拿着手机我们的信息其实就已经被悄然的发送到了第三方。小米就是一个很好的例子,不光是小米几乎所有做手机的,做智能终端的,做网站的都在搜集用户的信息。棱镜门不用说了,这个大家都知道,其实在任何一个国家,类似于棱镜门的事件都存在,只是程度不同而已。 [2015-03-27 14:28]

    [主持人]感谢周教授。接下来有请中国人民大学教授匡文波,报告题目为《大数据时代的个人隐私保护》。  [2015-03-27 14:27]

    [周庆山]比如说以前我们在讨论研究方法的时候经常谈三大纬度,一个叫客观的时政研究,另外一个主观的秩序研究,另外还有一个被称作追求一种第三条道路的现象学研究,但是我们今天思考的大数据它到底是一种倾向这种主观解释的还是客观时政的呢?它偏于哪一个呢?是不是真的就是一种新的现象学研究这些都是很值得我们去关注的,当然了大数据的研究同样存在一个问题。就是今天上午有很多人讨论到一个问题,大数据的特点就是混杂的,结构的非结构的,多类型的,量非常的大,而且这些数据它和我们今天的抽样的精准性相比是有很大的不足的。我们现在当然还有一个待会儿匡老师会讲到的,就是隐私的问题,其实大数据对于我们来讲其实世界很多国家都开始考虑围绕它来修订我们今天的一些政策规则,这些规则要从大数据的角度去关注,比如我这里也提到一些比如说上午很多人也提到了,就是现在国际上在关注一个什么话题呢?叫"数据的开放问题"政府的数据能不能开放出来,共享。科研机构的数据能不能开放出来,这些商业网站的数据你能不能有一种方式把它开放出来,开放出来为我们社会进行利用、进行加工、然后进一步的进行服务。因为现在的这个数据被特定的平台包括像马云的平台、很多平台被它垄断。有一些被移动垄断,垄断之后自己也想说这是我的资源,他也知道这个东西不能随便给别人,我要给了别人,那我的专有性就没有了。但是,这些资源今后应该如何去开放?它的专有性、垄断性,另外这些数据里必不可少的一个话题就是安全问题,信息的安全,还有商业的秘密,还有个人隐私的问题,这些都是值得我们去关注的一些话题。好,谢谢大家! [2015-03-27 14:25]

    [周庆山]我们需要关注,我们以往的研究方法怎么能够借助大数据。我这里面比较了一下传统的传播学研究有这样一些方法、问卷、内容分析的、深度访谈的,有些属于秩序研究,像扎根理论、焦点小组等等,这里列的不够全。 [2015-03-27 14:24]

    [周庆山]那么对于传播来讲它也有一个很重要的应用在于,我们分析传播源,传播的文本,比如说现在的情感分析,就是内容特别网民发表的内容。还有像微博上的舆情分析也是应用了一些大数据的理论。然后方法,另外媒介属性的分析,不同媒介它的特点、它的生态规律、它的演化规律,特别是现在社交媒体的应用。然后现在用各种各样的方式,来对各种各样的媒体然后进行一定的数据收集、汇总,来分析比较这些数据它的用户流量是多少,这些数据的传播能量有多少,它传播了哪些数据量。另外一个就是我前面讲到的,生成的数据里有一个很重要的方面,大量的数据。但是,我觉得这部分其实以前有个理论叫数字商品论,现在可以叫数据商品论,那么还有就是它的效果的问题。在这个部分里头,有很多的成果涌出来,这些年也有很多传播学研究、媒体研究和信息研究都在讨论一些用大数据去分析的一些成果。比如说比较多的用在社交媒体的研究,特别在国外这是一个新兴的很热的学科。另外上午有人讲数据新闻的研究,特别是强调社会网络的影响。包括,社会网络的分析,另外就是互联网的舆情分析,用户、网络用户的消费模式的分析。 [2015-03-27 14:21]

    [周庆山]那么这个大数据有很多的模式,其实它从某种意义上来讲是计算机技术还有就是数据的科学技术在后面的应用。那么这种应用,我们说它对于科学研究来讲就是变成了一种新的挑战,过去我们在科研当中我们要研究一个对象的时候,特别时政研究我们都要做一个抽样调查。按照这两位学者在大数据里说到的,就是大数据时代的抽样和我们过去的抽样是不一样的。我们现在不会,也就是我们现在讲的,不是像以前讲的小样本的东西,而是用全样本。传媒进化,实际上我觉得大数据还不能光说数据这两个词,数据容易给人感觉是数学,或者是数字。实际上我觉得这里面的大数据有一个很重要的东西是什么呢?就是数字内容,大量的数字内容。而这种数字内容我们现在需要对它进行一个原数据的标引,建立起一套系统,在这些原数据标引过程中我们就从这些数据里头找到一些,发现一些我们过去不容易找到的一些规律。这种规律甚至在国外也做了一些实验,通过这种来分析一些人过去很难分析的行为,通过传感器把他每天每时每刻搜集起来,有的时候可以分析人的疾病,他的趋势。比如每个人身体上有各种传感可以随时把数据收集起来然后定向的跟踪。就像以前我们说高血压我们测量24小时,以后可以随时动态的测量,然后把大量的数据汇总起来。甚至可以描绘一个人把这个人变成一个虚拟人然后来构建起来。 [2015-03-27 14:19]

    [周庆山]那么我们说大数据现在有一个观点,科学的研究也进入了一个叫数据科学时代,那么这个研究被称做叫什么呢?按照格雷的观点叫实验科学、理论科学、计算模拟之后第四范式叫数据密集型心科研这样一个新时代。这个大数据的应用比较多讨论的是公共治理,比如现在用大数据整治交通的问题、公共卫生的问题,你比如说百度的李彦宏就说了,我们将来必须要改变。今天我们挂号人山人海,我们要解决怎么能够让他们不用去挂号,凌晨就去挂号,很多号贩子,你看现在很多火车票就解决了一部分,订票系统解决了一些。还有一些商业营销的应用。还有一个就是我这里想说的,它实际上也是一个方法论,大数据它可以作为科学研究,而且这种研究已经应用到了很多领域,比如说生物信息、生物医学、地震预报、天气预报。那么特别是有一些很有意思的研究应用,你比如说谷歌用它海量的数据开发了一个叫"谷歌流感趋势"的工具,通过这个大数据上的搜索,可以去分析流感的发病和它的增长趋势。另外一个,甚至以前中科院有个博士生他研究一个问题,就是根据搜索的数量来研究股票的市值的增长和它的演化。 [2015-03-27 14:17]

    [周庆山]我这里头列举大家都比较了解的,我们实际上研究传播学,研究数字媒体,研究社交媒体,研究信息问题,在学校里的研究也好,包括教学也好它也面临大数据的挑战,什么挑战呢?就是大数据条件下的研究方法的挑战,所以我今天想讲的问题主要从研究的角度。我们这里头对大数据的研究,首先我们做了一些搜集,大数据虽然我们好像平时不怎么看得到。但是我们的研究说明了它这个事实的存在,就是人们关注的焦点。我们这里统计了从2010年到2014年,这些年研究的论文有3598篇,而且大家可以看出来它有了一个爆炸性的增长在2013年到2014年,增长的速度非常的高。这就说明什么呢?大数据它不仅是业界关注的话题,而且是很多行业关注的话题,同时它也成为我们科学研究像我们大学的老师关注的一个话题。 [2015-03-27 14:15]

    [周庆山]我这正好又看了一下伍老师编的那本书上有一个口径,我觉得数据非常好。我在这里抄录了几个,全球的网民是24亿,亚洲是11亿,全球有11亿的智能手机。这些东西意味着什么呢?就是过去的传播对象是读者、是听众、是广播的听众、是观众。今天受众是什么呢?就是这上亿,几十亿的网民。这些网民像过去通俗的讲叫产销合一环境下内容生成环境下他们就是大数据,这个大数据也就是我们要关注的一个很重要的内容。 [2015-03-27 14:14]

    [周庆山]非常感谢我们伍刚主任邀请,我今天来真的是学习来了。在座的各位都是我们媒体界还有学术界对这个题有很深的研究。我来了一看是一个很大的论坛,我其实我本人工作的单位并不是媒体界,我们这个单位就是李彦宏毕业的单位,百度李彦宏原来是读书情报系现在是信息管理系。这个李彦宏我还想说一下,实际上我们说,原来我们学科的学生毕业比较多去的是IT界、情报界这个领域。但是现在随着社会发展、信息化的发展,确实出现了一个新的趋势,就是信息技术和媒体的一个融合,包括电信的融合带来新型的社会形态,这个形态就使我们这个信息管理和我们媒体传播有机的结合。比如说百度可以说是一个IT行业、互联网行业。但是像百度、新浪、网易他们现在越来越具有一定的媒体性。今天上午听了几位专题讨论讲了一个问题,其实现在对大数据都会问一个问题,大数据到底在哪里?我也在想这个问题,大数据是不是离我们很远,我们现在讨论的是一个虚无缥渺的东西。我记得去年在微信上看了一个很有意思的笑话,说北京老是不下雪,偶尔有的地方见着下了一点就像大数据一样,只是听说过没见过。这个大数据实际上我自己这样想,它其实跟我们这个媒体关系还是非常密切的。它的密切一个非常重要的方面,我觉得就是大数据现在就来源于什么呢?媒介融合下的受众。以前我们在传播学里面,我们关注和研究的受众问题,但我们说今天的这个受众是哪些人呢?今天的受众我觉得最代表性的就是我们现在的网民,比如说有一个调查,现在中国的网民是6.75亿,手机网民是5.57亿。 [2015-03-27 14:11]

    [主持人]尊敬的各位领导、各位来宾,大家下午好。下午我们依旧为您带来主旨报告与论坛讨论。接下来邀请北京大学信息管理系教授周庆山,报告题目为《作为信息管理领域研究方法的大数据应用初探》,有请! [2015-03-27 14:07]

    [李兆强]所以说,我的观点是现在大家都觉得大数据这个概念非常火,好多人并不是特别了解都是盲目跟风,所以说你有的时候冷静分析下来,我们做的也只能从我们最基础的这些东西开始做起,慢慢的有可能未来大数据能改变我们的方方面面,谢谢,我今天就分享这么多! [2015-03-27 12:28]

    [李兆强]但是刚才唐老师也说,现在的大数据的数据源基本上都是掌握在政府和BAT特大型的公司里,我们现在所做的这些数据只是基于某一个点或者某一个行业里面的这些数据,我们做这个行业里面的一些细分分析,我们也只能做到这些,你想拿到BAT或者政府部门的数据那不太可能,所以说现在大家都炒大数据。这个概念在中国国内已经有5、6年的时间,我们现在还没有看到成熟落地实际的项目,只是针对某一个行业里面的某一些行业的数据分析,现在也基本上都属于数据库,还谈不上它是一个十分强大的大数据,所以说基于很多方面的思考你在大数据这一方面我们要考虑到政策风险,你肯定要考虑的,再一个版权,互联网思维不是讲究分享嘛,你要分享肯定有版权的问题。还有个人隐私的问题,这不是单单企业或者是个人可以解决的一个问题,它需要一些政策的导向、政策的扶持,所以大数据我们应该往前看,现在的演变的过程只能慢慢通过市场跟政府的双重调节,才能达到我们预想的就像保时捷这位先生说的,未来无人驾驶1.0、2.0,我们能想象出来的这样的场景。 [2015-03-27 12:26]

    [李兆强]不敢不敢,今天这个机会非常难得,我们的实验室其实成立的时间比较久,05年就成立了,之前主要是做一些民意调查,媒介与公共政策研究主要是跟咱政府部门尤其部委单位合作的比较多一些,在去年年终的时候我们成立了一个新媒体的事业部主要做电影大数据。这个平台是国内第一家分析的平台,我们现在整合了我们之前前几年所做的工作,因为我们有自己网上的调研平台,以及我们线下的一个调研团队,这些数据积累才研发出来今天我们所看到的电影大数据,这个电影大数据主要做什么呢?我们针对即将上影或正在上映电影票房的预测以及电影的口碑还有观众心理的细分我们通过这些我们搜集的这些数据进行分析对比,对这些电影的制片方、发行方能提供一些数据的支持。虽然我们做的这一块算是比较细的,我们只是在电影行业这一块然后做了部分的前瞻性的一些工作。 [2015-03-27 12:26]

    [官建文]下面清华大学的李兆强老师做总结吧! [2015-03-27 12:23]

    [张久鹏]当车到了我们的服务场所之后您可以在您家的远程看到您整个维修过程,让您真正实现了拥有爱车之后不需要到我们4S店或者修理厂就能让你整个车从您的洗车,从您的保养到您的上门接送到维修,包括整个零部件的供应都可以实现整个一个数据库的大数据管理,这只是,当然这些问题我们其实已经很近了,甚至在未来的一两年之后我们就能看到这些技术,因为产品已经在做研发,同时已经在欧洲国家甚至在部分小的城市或者是区域性在做一些尝试。像刚才主持人讲的说无人驾驶,我可以告诉大家再具透一个信息,无人驾驶已经是1.0版本或者2.0版本的技术了,我们在研发中心已经开始做无人驾驶之上的无人驾驶加办公的方式,将来我们可能很多办公已经不局限于soho一族了,是移动一族。我从我家出发到公司可能堵车会堵一小时的时间,我把我的车设置到一个好的目的地,我预期的一个计划的目的地的方向,我何以让它自己来实现无人驾驶,他有这种主动完全的设置,我可以在这里面在后座上里面有可折叠办公的用品,包括一些移动终端和一些行车电脑以及整个操作系统和远程视频的会议交互系统,我们直接在我们这些车里面就可以完成我们在办公室里面做的事情。因为我们这些技术我们会通过我们现在和连通有一个云服务的合作,当然已经开始在去做一些初步的接洽,您的整个工作的流程,包括整个工作环境,以及甚至说车的维修过程、保养过程都是可以在云服务空间里面能够实现整个交互对接的。我们除了睡觉是需要回家以外,当然您也可以选择不回家睡觉,我们基本上基本您的工作和生活与车有关相应的衔接的话,都可以在移动过程当中完成的,这也是大数据时代给我们的生活甚至给我们的汽车生活带来的一些改善。谢谢大家!  [2015-03-27 12:22]

    [张久鹏]刚才听了前面嘉宾的分享,应该说我们从事这个行业可能是在座今天各位来的都比较少,或者说过去我们在讲大数据的时候跟我们可能会有些脱节,大家总认为这是跟互联网跟媒体或者是高科技产业关联比较多的一些领域,但其实的话过去我们汽车行业我们在做的是数据营销或者数据分析,我们只是简单的把我们车主的一些消费特征、包括他的信息通过最传统的垃圾短信的方式或者是一些推送方式能够跟用户做一个交互的对接。但是从大数据这个时代开始之后,其实这种方式离我们而言已经是一个很古老、很小儿科的玩法了。不管刚才是我们的主持人提我们无人驾驶也好,甚至更好的东西它都是在应用于我们的生活当中的。我们就拿我们现在一个很简单的应用来举例,过去大家总认为大数据时代可能离我们很遥远,甚至像我们传统行业大家认为你们就是一个生产型企业,一个服务型企业,只是去生产车去卖车,去修车有二手车业务,其实的话现在已经不仅是这么简单了。我们举一个最简单的例子。过去我们要去给我们车想去做保养维修的话,我们得需要把车开到4S店,或者是一些维修场所,我们在那去等待半天的时间或者几个小时来给自己的车进行修理,这里面怎么修的,换什么东西都是很多潜规则的项目在围绕着我们这些用户的眼球或者是我们的消费的账单里边。但现在的话这个方式已经发生了质的改变,当您的车不需要可以开到我们服务场所,您可以在家里面通过您的手机APP或者打一个电话有人上门把车去做保养,如果说您的车需要维修会有人提供上门取送车,大家说我几十万上百万的车怎么给一个陌生人去驾驶呢?但是你可以通过APP车整个的行驶轨迹,包括驾驶员的相貌特征,您车内的使用环境,您车外的部分信息,您不用担心车是被谁开走的。而且现在我们已经能做到什么程度呢?这个产品很快就会问世,能看到整个车行驶过程中它的耗时、油耗、功率、做功、行驶时间、里程等等相关的一些数据。 [2015-03-27 12:21]

    [官建文]下面是保时捷品牌经理张总,我们知道现在有一种说法以后汽车无人驾驶,会变成一个数据中心,张总给我们介绍一下你们的行业大数据怎么给我们带来一个更好的未来。  [2015-03-27 12:17]

    [姜飞]最后一个问题想跟大家分享的是,大数据给我们带来哪些绝对性的变化,我跟大家分享两点。第一大数据就是刚才第二个思维下政府集团和黑客在掌握着真正大数据的情况下,我们会发现普通公民在享受大数据给我们带来的滴滴打车这么简单的快乐的同时,大数据或者数据的价值已经是对上绝对的升值,对下绝对的贬值。这句话大家怎么去理解,政府、公司可以最大限度的把我们的行踪记录开发乃至于推送,所以这个数据的价值对他们来说是绝对的升值,但是我们普通的民众这些价值是绝对的贬值或者是绝对的下降,我们是绝对的弱势群体,在大数据时代我们是非常可悲的,这是第一个给我们带来的巨大的冲击。第二个巨大的冲击那就是突然间大数据时代到来以后,我们有一个概念突然落实了,那就是以前所提的互联网思维具体化就是数据化思维,怎么样用数据,怎么样用计算的方式重新看待人与人,人于他人以及人与社会大众传播的连接。在互联网时代你说大众传播时代的结束,恰恰用这样一种方式来表达,正是因为数据、信息以及计算能力和数据与数据之间人与物之间的可视化和具体化使得大众传播在今天发挥真正的效益。甚至说是传播治校的一个真正开始。 [2015-03-27 12:16]

    [姜飞]我给大家举一个例子就是香港占中期间,通过我们官方的舆情机构根本打不进去的,并且它自己内部之间很多人之间互相的信息通过一个软件根本是我们以往网络监控的工具是进不去的,也就是在那样一段时间之内,特定的时间和地点上那个数据是无法获知。所以这样一个数据就是值得我们考虑的空白或者是盲区,这是第一个问题数据在哪里必须要有发现的能力。第二,大数据在哪里?或者换句话说从产业的角度来说,这些数据能够换来真金白银的大数据在哪里?我们绞尽脑汁去想大数据在谁的手里,实际上只有三个主体能够掌握真正的大数据,因为大数据实质就是全数据,换句话说你是小样本的一种采集,如果没有统类或者是相关信息的全数据,那你这个大数据的话还不过是数据库以及部分的信息。所以大数据在谁的手上,第一像淘宝、腾讯这样拥有强大的后台以及高速的社会计算平台这样一种商家和机构包括中国移动,因为它记载着我们每一天手机或者移动所有的信息,这是公司所谓有钱的人。第二政府有权力有资格来到公司的后门,说你打开后口我需要一些数据,所以政府理论上拥有着所谓的大数据。第三那只有黑客,所以我们现在谈大数据都是在很大程度上是一种做分母或者是跟着大家凑热闹,但是大数据在谁手上,谁在真正的玩大数据,这个问题没有想清楚。 [2015-03-27 12:14]

    [姜飞]谢谢主持人,相对这几位真正的关于数据行业的专家来说,我就是打酱油的。应该说是在新闻与传播领域关于数据研究已经实行很久了。今天跟大家分享的只是从理性思考不能提升到理论,理性的思考就是对数据有三个问题,是不是我们可以在这个场景下我来提出来大家追问一下。第一就是数据在哪里?第二,大数据在哪里?第三、就是针对大数据我们发生着什么变化?我简单说吧,第一数据在哪里?像刚才唐老师还有几位说的,我们其实由原先的现实生活中客观的物体所发生自然现象的记载,人类的视角已经转向活动移动的人群,每一个人人变成了流媒体,人自身在每个时候消费以及任何时候使用任何形式的媒体和媒介的时候就在不停的生产着各种讯息,但是在以前的话是通过传媒、新闻机构把这样纷繁复杂的信息通过专业的人士采集,以及消除我们大脑中的不确定性,以及使得我们对问题产生了很多新的办法。但是当数据已经淡化,媒体终端多元化,数字技术的积累的速度已经是提升到很高的一个水平的时候,数据突然之间变成一种爆炸,那么第一个问题我们就要问数据在哪里?那就在移动中,在路上,并且还要在数据爆炸的时候我们可能还要关注另外一个问题,那就是哪里的数据我们没有搜集到。 [2015-03-27 12:12]

    [官建文]谢谢唐老师,他对传媒形态、传播的视点概括的很重要,以后5G来了以后不可能买马车、牛车肯定是要跑形象的东西。下面是姜老师,他是从理论上面,姜飞老师很有研究。你从理论上来提升一下。 [2015-03-27 12:10]

    [唐兴通]第二个,互联网的第二个转型正在进入一个连接的时代,腾讯正在鼓吹的就是社交网络里面人与人的连接,人与物的连接,物与物的连接,这跟我研究的方向比较接近的在社会网络和信息传播的结合,这个在美国随着Facebook和推特在这样的话,应该说大众传播的时代已经结束了,接下来更多的进入到一个社群传播,一个窄众传播,一个基于社会关系流动的信息传播,那么这个时候,我们媒介传播的信息也更多的跟社会学、物理学等等这样的一些数据模型结合,这个是物联网的第二个转型,精准了一个连接的时代。那么互联网第三个转型最近炒的特别热的就是社群经济和社群时代,以小米手机为代表的很多社群的游戏规则,那么社群里面人与群体之间的互动、行为、信息传播它的背后也是数据,如果我们能够更好的理解数群,必须从数据开始,从消费者和行为在线开始。第四个,互联网进入了一个第四个拐弯处,这个传媒圈的同志非常认可的就是内容传播时代。刚刚我们黄总讲的可视化,可视化新闻只不过是信息改变了传播的形式。我今年把美国还有一本书带入中国,叫做《视觉营销》其实互联网到现在,文字在互联网上流动它是一个主流,但是我想告诉大家的是,随着大数据时代的来临和移动互联网来临接下来像我们小马奔腾还有很多音视频和图片的春天即将来临,如果你是一个记者只会写文字,在未来没有人那么闲得荒,但是可能还会有一部分性感的是音视频和图片时代,这是我基于大数据或者数据传播的,对于新闻传媒的一些构想,谢谢大家!  [2015-03-27 12:09]

    [唐兴通]给我出难题,以前经常到大学和商学院去谈,之前的背景因为也是大数据的背景,但是耐不住寂寞就出来了,当年也有同学学的是一个兴趣其实是我们当年的图书报,后来做了数据仓库,后来耐不住寂寞就跑到传媒这边,现在主要做新媒体在互联网上的传播还有社会化媒体。那么正如马云上一周说了一句话,互联网正在从IT转向BT,其实确实在未来的时候我们这个时代正在进入一个数据的时代,今年我正好有一本新书,我总结了大数据时代对于传媒的四个转向这地方跟大家分享一下。第一个BIT的话正在从入口之争转化为场景之争,随着移动互联网、大数据、物联网还有很多新的技术的出现,在互联网的时代、智能时代不仅仅是预制场景,是场景感知。像以前经常会出现的是中国移动他会站在这个地方给你群发垃圾短消息,这个不能叫场景感知,他是把所有人只是一个点来予以的。那么场景感知是可穿戴设备、云计算、大数据、移动互联网、社交网络数据以后在大数据其实核心是行为数据,我们传统的结构化的语言存在银行里的,存在数据库里面的都是死数据。其实未来更多的10086小妹的语音还有你的很多垃圾的数据也会通过处理以后提炼出来的模型更好的去感知这个场景。 [2015-03-27 12:07]

    [官建文]下位是唐老师,他是电子商务协会研究中心的专家委员,又是社会化媒体研究者,他在很多大学里面当老师,当评委。你能不能够用三句话来概括大数据在媒介产业里面它所发挥的作用。  [2015-03-27 12:06]

    [钟丽芳]谈到这个我又有一点点体会,在中国我们收集有效的数据还是比较困难的,貌似好多公司都在做大数据,拿来看是不一样的。所以当它在收取这个数据的时候是不是有效的,是不是真实的,直接对我们后面要用的客户造成影响。所以我也是希望在未来的这个时间里各位专家、老师能够对大数据有更多的帮助,我就是受益者我们能从中得到更多很精准的数据,从而把我们的影视作品做的更好,谢谢大家! [2015-03-27 12:05]

    [钟丽芳]然后我们在怎么组合我们影视作品,从创意团队、演员、我们以往也是凭我们的经验来判断,就是大家基本上全中国人民抢所有的影视公司抢的都是几个一线的大腕,但是真正想到抢到她不一定是市场效果最好的,因为只有对你的观众的偏好更清楚才能知道我一线的可能男明星搭一个二线的女明星,甚至说电视剧,在电影明星跟电视剧明星其实是分的很开,我们在这种搭配上往往会比以前更有科学性。我们为了同时覆盖70后、80后、90后他们喜欢的明星是不一样的,他们喜欢的表演方式、形式甚至是不一样的,价值观都不一样,我们同时都在讲一个爱情故事。可是60后喜欢爱情的方式、谈恋爱的方式跟90后就非常不一样。经过好几次的尝试我们觉得也还是要非常清楚受众。受众怎么来了解,我们大多数都是抓取的一些大数据进行分析得来的。不光是我的电影、电视剧是这样,最近做了好几个特别大的互动式演出。今年8月份要上一个全球最大的冰上秀,可能大家都看过冰川世纪,我把这个项目带到中国的时候,我首先是要提出合作方是谁?现在卖票大家都知道有好多肯定是最大的,有好多,我怎么来挑最适合我的排挡,我的确也抓取了很多大数据,有些是公开的,有些是买的,现在来看的观众做了一个分析,我们就得出的结论就是说可能真正自己去主动有意识的去搜寻演出的这个观众不到20%,占的比重比较小。能传递信息马上能感兴趣的观众占到20%-30%之间,这一类又会影响到另外的20%多,他会把信息传递过去,到后面可能就是兴趣比较小的,我们就做了一个峰值,最后发现如果你把传递给他,他可能会产生购买的人数是达到了60%左右,所以在这种情况下我们就放弃了选择大麦网作为我们的选择,我们选择了微票,因为它会是更精准的点对点的到岗,在这种情况下现在说起来是结论,这个过程还是比较漫长的,我们要收集很多的数据。 [2015-03-27 12:05]

    [钟丽芳]我们可能只能从我们作为用户怎么样来利用大数据来做我们的项目,不好意思。因为我实在不是一个做技术的,然后今天高老师让我来参加这个论坛,我犹豫半天好像跟我的专业不大符合。但是他又说从我们用户的角度来说还是很有相关性的。我们做不管是做电影、电视剧,或者是我现在做的大型的互动演出,其实跟大数据还是很有相关性。我们比如说在选一个电影题材的时候,以往的方式特别简单粗暴,就是说我导演喜欢什么,制片公司的老板喜欢什么,根据自己对这个行业的理解来选择题材。现在随着大数据时代到来,我们可能更多的是我们喜欢哪一类的题材,然后根据受众他们的偏好和需求我们更了解就是说我们的观众他们喜欢什么,然后再结合我们这个创作者的比较擅长的创作题材结合找出一个平衡点来选出这样的题材来,这是从选择题材的方面。  [2015-03-27 12:04]

    [官建文]下面请君舍文化钟总讲一讲,讲一讲怎么运用大数据来做更好的文化产品,刚才玉辉说了大数据可以做善事也可以做恶事,你介绍一下将来利用大数据你已经进了40强精英榜,争取以后进到百强里面去,现在我们请钟总说一下。 [2015-03-27 12:03]

    [付玉辉]另外很多老师也讲到大数据的开发和使用现在还控制在少数人的手中,更多的大众或者说和媒体对于大数据的使用其实还是有很高的门槛,我是希望将来在大数据应用方面出现更多的公益组织,更多的向社会和公众提供开放的这种公益的服务,从这个方面来弥补因为大数据使用而形成的鸿沟,我觉得这个可能是需要大家以后关注的一个问题。谢谢大家! [2015-03-27 12:02]

    [付玉辉]另外一个我简单谈一下我自己对大数据的理解,我觉得大数据它来自于一个虚拟的世界,就是说是一个数据构成的世界。那么这个虚拟的世界正在对我们现实的社会产生越来越深刻的影响。现在对我们现在的人类社会来说虚拟世界其实已经成为一种现实,我觉得这是一个很大的变化。但是我们平衡现实世界和虚拟世界的这种关系的时候,我觉得我们不应该忘记大数据它本身是一种工具,它具有中立性,它的这种中立性导致了说这种大数据的方式我们也可以做善事,也可以做恶事需要我们去平衡的,尤其是运营商要保护用户的信息安全,所以说这个责任也是非常重的。  [2015-03-27 12:01]

    [付玉辉]简单介绍一下大数据方面的企业,我本身不是做技术研究的,我只是从概貌方面给大家做一些介绍。从大数据的角度来说电信运营商包括中国移动、中国电信、中国联通三家运营商我们掌握的数据也是非常多的,刚才有老师说比如说像淘宝,互联网的公司他们有很多数据,我们的数据也是非常之多,但是大数据的金矿怎么去挖掘,怎么去使用,这个对我们来说也是处于一个初步探索的阶段。但是在使用大数据的同时怎么去把握大数据当中一些需要平衡的问题,这个其实也是非常重要的,对于我们企业来说在大数据这个方面我们专门成立了一个数据中心,然后对全集团分布在各个分公司的数据的采集工作这个我们已经做过了,另外我们已经也建立了一个大数据的管理平台,我们未来的发展方向是希望我们这个大数据平台能够为社会提供基于大数据的服务。目前我们在集团层面和在各省分公司的层面都通过大数据的方式在为我们的用户服务做工作。比如说我们的用户,比如说它有可能会出现离网的情况,就是不在采用我们的服务,这种情况下我们通过大数据可以预先来判断它会出现这种情况,然后提前是做用户的维系,这个准确率也是在70%左右。另外在世界杯期间,我们专门的向具有这方面需求比如说在手机上看球赛的用户我们通过大数据的方式为他们划项找到这部分用户,对他们定制流量的套餐让他们享受到特殊的服务,这个准确率是非常高的。我们基本上是在做这方面的服务。将来我们也希望在电信运营商这个大数据的基础之上我们能够为社会提供更多开放的服务,这是一个简单的情况。 [2015-03-27 12:01]

    [官建文]刚才各位嘉宾都介绍了,时间比较紧。大数据媒介产业也是一个很值得探讨的问题,我看这样请各位嘉宾把你最主要的观点跟大家分享一下,论述、阐述以后我们再找时间。 [2015-03-27 12:00]

    [李兆强]各位好我是来自清华大学实验室的,我们这个实验室主要做一些媒介调查与公共政策研究方面的一些工作,在去年年终的时候我们成立了一个新媒体的事业部,主要是做电影方面的大数据,我们在去年年终成立了中国电影大数据分析平台,这是国内第一家。然后待会儿我会详细的跟大家分享一下。谢谢! [2015-03-27 12:00]

    [张久鹏]大家好,我是张久鹏来自于保时捷汽车控股集团中国区的大众品牌总经理,我们的主要业务方向是做大众汽车集团及全球各大品牌在全球的运营管理,谢谢! [2015-03-27 11:59]

    [姜飞]大家好,我是姜飞来自社科院新闻传播研究所,我个人的兴趣基于新媒体对文化传媒的关系以及跨越国家地区边界的传播,希望跟大家分享谢谢! [2015-03-27 11:58]

    [唐兴通]大家好,我是唐兴通主要是新媒体网络和传播这一块的,最近写了一本新书跟大家分享一下,在社群经济、在连接时代,在场景感知的时代,如何同大数据结合,谢谢大家! [2015-03-27 11:58]

    [钟丽芳]大家好我是钟丽芳,我是做大数据的,我想大家可能比较熟悉,现在有两个新的公司一个是中国百老汇和百老汇做的合资,今年年底前会推出几个特别大的活动式的演出,也是一个新的尝试。然后我们当然还会有电影、电视剧的作品推出谢谢。 [2015-03-27 11:57]

    [付玉辉]我是中国联通集团付玉辉,这次非常有幸参加大数据的论坛,谢谢大家! [2015-03-27 11:57]

    [官建文]我们今天这个媒介产业论坛开始,刚才吴总说我们时间要抓紧一点,半小时,那么我看这样开始没商量。你们各位嘉宾先简单的用一两句话介绍自己,然后我们就结合这个话题每个人讲四分钟吧。就这个话题讲,向媒介产业可以从文化各方面讲文化产业,还有姜老师你从传媒这方面结合自己的研究的自己的特点,自己的工作。 [2015-03-27 11:56]

    [主持人]让我们回到研讨会的进程中,接下来,我们有请人民网副总裁、研究院院长、国家社科基金重大项目首席专家官建文主持"大数据时代媒介产业"论坛。嘉宾有小马奔腾董事、君舍文化总裁钟丽芳、中国社会科学院世界传媒研究中心主任、博士生导师姜飞 、中国电子商务协会专家委员唐兴通 、保时捷汽车控股集团中国区的大众品牌总经理张久鹏 、清华大学媒介调查实验室研究员李兆强。中国连通集团新闻宣传处副处长付玉辉。请嘉宾上台! [2015-03-27 11:55]

    [黄志敏]第三个是数据新闻网,数据新闻网主要是在境外读书的年轻人,他们很喜欢读新闻,他们用业余的时间搭建了这样一个网站,搜集了很多数据新闻方面的信息,特别优秀的一帮年轻人,跟我也是特别好的朋友,上面有一些资料,大家可以看一看。像有一些公号,这些公号的话,我认为都是跟数据新闻相关,第一个还是我们的公号,第二,全球深度报道网,这是港大新闻学院维护的一个帐号。第三个是大数据新闻,武汉大学维护的一个公号。第四个是复旦新闻学院服务的一个公号。而第五个和第六个是偏设计类的公号,我跟大家分享到这儿。 [2015-03-27 11:25]

    [黄志敏]这里是我们作品集的一个演示,我们所有手机类的作品都会放在这里。接下来的话,我会给大家分享一些我们在这以外做的其他一些工作。去年年底以来,我是跑了十多所高校,在许多高校做将多。主要以新闻传播学院为主,去介绍数据新闻的东西。我看到就是说,有一些高校现在已经非常的重视这个事情,那么他们是例如传媒大学、复旦大学等等,现在我都看到他们是在课堂上系统的教授这个数据新闻。那么我在做这件事情的过程中,我就会发现,我们太需要这种又懂新闻、又懂设计、又会写代码的复合型人才,但是我在国内一个都没有找到,在国外有,国内一个都没有,国内最好的情况是你能掌握其中的两门,而在国外的话,现在他们叫有意思名字叫哥伦比亚大学,他们都会开设的课是计算机和新闻的双学位,密苏里新闻学院也是,他们也会有意识的教授计算机。所以我认为这个是需要我们,业界和学界一起做这个事情,我也认为说现在在高校,新闻学院里头等等,就是你不培养复合型人才,你不培养将来要做记者的人,你不让他学写一些代码这是不够的。给大家介绍一下这三个网站,一个是我们自己的,这个叫数字说的网站,我们所有的数据都放在上面,叫财新数字说。第二个是叫财新数据可视化实验室,这个是实验室的网站,那么上面除了财新的作品以外,那么我们还放置我们分享一些体会、心得,那么上面也会有其他家的作品,以及我们平时搜集的很多案例分享还有一些活动信息等等,我们会放在实验室的网站上面。 [2015-03-27 11:24]

    [黄志敏]所以我们从去年年底到现在,我们做了很多的案例,这些案例的话,包括有支付宝的,有天猫的,有淘宝的,还有唯品会的,平安银行的等等,基本上来讲还有例如说之前的有一个市场调研公司,基本上来讲,或者是跨国公司或者上市公司,那么他们希望说用尝试更多的手段来展示他们的内容。像我们刚才为大家演示的产品,两天之内获得了二十万的访问量,作为一个市场回报来讲,这是非常划算的。 [2015-03-27 11:23]

    [黄志敏]这个项目的话是我帮支付宝做的一个项目,我给大家演示一下。我给大家解释一下,这是去年支付宝双十一的时候,还没开始他们就觉得战绩很好,他们希望把这个展示一下,找到我们。我们的长项是怎么把枯燥的数据变得生动有趣,我们就做这个项目。做这个项目的时候,这里头有非常枯燥的数据,我们把它做出来。但是我们在做这个的过程中,我们是要注意几点,第一就是说把这个称为市场企业化,我们要把这个市场数据和新闻分开,最后注上市场企化,写清楚我们的企业是做基础知识,或者在最后说这个数据是由客户提供的,这样来体现客观,这是第一个。第二个的话,我们不会通过财新的官方渠道会发布这个东西,如果你要通过我这边的一些渠道去发,那我会把它当成一个广告去发,会严格的区分开,这样才能保证你的新闻不会受影响。 [2015-03-27 11:20]

    [黄志敏]所以你可以认为说,我在这方面的投入主要是这四个人的工资,这四个人很优秀,里头我有的同事是又能写代码,又能做设计,包含有这样的人,这是控制成本。第二个的话,你要给企业回报。第一就是名,我们希望我们做的作品去评选评奖,一方面来讲如果得了奖,那么我们会有成就感、荣誉感,使得大家也会更努力。另外一个方面的话,你比如说我们在国内能拿第一,拿到国际上只能入围或者拿优秀奖,这样会给自己构成很大的压力和动力,逼你去进步。另外拿奖也是为企业在市场上做一个提升,也算是给企业一个回报。不白拿公司的钱。再有就是我们现在也帮一些其他的企业或者媒体等等,我们做一些可视化的外包,把我们的技术输出出去。在这个过程中,我们把自己看成是一个技术服务公司,我去做这件事情,也能给企业带来一定的回报,通过这样的事情,这样才能有可持续的发展。 [2015-03-27 11:19]

    [黄志敏]另外一个,就是说有时候大家也会有人问我这么一个问题,你们做数据可视化,你们做数据新闻怎么挣钱呢?这个当然是我们要考虑的事情,你做这个事你要挣钱。我做数据新闻我是有把握的东西,第一,你不要做太大投入。那么在国外,做数据新闻谁做得最好?《纽约时报》,然后接下来是英国是《卫报》,还有布隆博格等等都做得非常棒,有那么几家,还有美国的NPR,纽约时报的水平是最高的,成本也是最高的,他们当年有一个作品获得奖了,就是《雪崩》,据说是花了450万美元,这个成本在我们看来是不可想象的,你花那么多钱做这样一个作品,第一我在水平上努力去追赶它,我希望未来能够赶超它,但另外一个我在成本上必须要控制,我不可能这么去做。因为这么一个事情,你要做一个新事物,然后你还要做大投入,你还看不到回报,最大的可能就是过不了半年就被砍掉了,我们要考虑一个发展的问题,这是第一个,所以我们要控制成本。那么像我这个团队大概十个人,其实其中只有大概四个人专门干这件事情,其他的人还在兼顾干着其他事情。  [2015-03-27 11:17]

    [黄志敏]那么每两个月一次公布摇号的命中率,它是个新闻,但是这个新闻点特别小,你就公布一句话没别的可说了。我们做这个项目的时候是去年六月份,那时候公布出来的摇号的命中率是一百三十七分之一,很多人对这个数字很麻木的,问题是说如果我告诉你,咱们现在每年只能摇六次号,就意味着你平均得摇号22年,你22年之内能摇中你都算好运,这样的话大家的感受完全不一样。但是这样还不够,那我写一段程序,就算大家真的就是说拿个手机去摇一摇,事实上说从这个月摇摇到哪一年能中?第二年你的机会会变成两倍,第三年会变成三倍,大概每个月增加多少人去摇号,我把公式列给你,你就试,你看哪一年能摇中。有的人很幸运一下就摇中了,有的人五十年都摇不中。很多人体会非常多,他会把这个体验分享出去。所以我们做这个项目的话,我们只花了半年的时间,中午决定,那天下午就做了。花半天的时间,我想尝试一下朋友圈的推广效果,我们就只有两三个人把它分享到朋友圈,其他人看到又尝试分享,第一天访问量大概有三千多次,第二天变成了五千多次,到第三天突然就变成了三十多万次,到第四天的话是五十多万次,就这么爆发。那么,结果到这一个星期下来,一共攒了150万次的访问量,大概是这么一个状况,我们就觉得这个还挺有意思。后来大家也从不同的渠道,也都感觉到在朋友圈里做游戏这种方式很有意思,所以后来神经猫之类的都出来了,现在不稀罕了,现在在朋友圈里看到这种游戏不稀罕了,但是举个例子,你有没有第一个想到把新闻变成游戏呢?这个需要我们经常拍脑袋想的,下一个可能的机会在哪里,下一次的机会我们要抓住,这个东西是我们需要一方面做随时的准备,一方面要同时去想。 [2015-03-27 11:15]

    [黄志敏]数据新闻,除了在电脑上呈现,还可以在手机上呈现。我们现在越来越重视在手机上呈现,为什么呢?理由很简单,现在那么多的人花那么多时间用手机上网,你不能忽略这个渠道,这是第一。第二在手机上传播要方便的多。刚才我已经说了,就是说你始终要考虑渠道的问题,要考虑传播的问题,因为我们现在看东西很多是通过朋友圈分享,那你看完一个东西,你一下就能分享出去,这个是非常方便的东西。所以,在手机上比电脑上传播要方便得多,因为电脑上我们必须得把这个链接通过微博、微信等方式分享给别人。但是在手机上做项目跟电脑上做项目是有区别的,第一个区别是手机的屏幕比较小,显然我没有办法把它塞到手机里头去,我们试过,做不到,体量太大,手机确实有限,这是我们第一个要考虑的。第二个是操作方式的问题,因为在电脑上我们可以用鼠标做很精美的操作,但是在手机上不行,手机上我们只能用手指头。所以的话意味着你这上面能操作的位置是有限的,但是它除了点击,它还可以滑动,还可以放大、缩小、摇一摇,所以操作方式不一样,它决定了你产品设计必须有不一样的特点。那第三个的话,是开放的接口不一样。在手机上,我们说摇一摇,这是运动传感器,那么它还有可以用声音,像我们平时拿手机这么催一下,催一下实际上是用声音传感器的过程,然后我还可以用摄象头拍照片,拍视频等等,它能提供的接口不太一样,它能帮你定位,不太一样,整个产品的设计都应该不一样。所以我们现在的一个原则是什么呢?我们现在采取的原则就是移动优先,现在基本上来讲,一个项目有可能我们手机上做一个作品,电脑上做一个作品,或者说我做一个作品两边会兼容,我尽量去做。但是如果说我人力跟不上的话怎么办呢?那么我用的方式就是说我宁可PC上不做,我也要做手机上的,除非这个手机上没法呈现就算了,所以我们是移动优先。那么下面给大家分享两个案例,第一个案例是怎么把新闻变游戏。那摇车号这件事情,我觉得已经不需要解释了。 [2015-03-27 11:11]

    [黄志敏]做数据新闻就不一样了,数据新闻整个生产流程要变为什么呢?当我做数据新闻的时候一个选题定下来,第一个要看它有没有足够的数据,如果说没有数据的话这事没法干。第一个有数据以后大家三伙人坐在一块商量说,我们这个数据新闻用什么样的形势去表现会比较好看。然后大家都觉得好看,这个时候程序员就得跑出来那如果比较好看的话,这个我开发看能不能实现,成本高不高,时间赶不赶得急。如果发现说开发上不可承受的话,我们还得倒回去,修改这个设计方案。那么它本身就是一个互动的过程,等到这个方案确定了,等确定以后可能反过来我们得去倒推,推回去得跟记者说不行,数据不够,你再给我补些数据过来。 [2015-03-27 10:42]

    [黄志敏]这个实验室包括三种人,第一种是记者和编辑就做处理稿件的人。第二个是美术设计师,第三种是程序员,三种人组成了这个。那么做数据新闻的话其实对我们过往的整个新闻生产流程是有一个非常大的变化。什么样的变化呢?过往的新闻生产其实从文案到设计到技术其实是个上下游的关系。基本上稿子是谁定的,稿子是记者跟编辑定的,那么其他的人员设计师也好,技术也好在这个里面起的是什么,是支撑的作用,稿子出来了由美编去帮助配图再有技术人员把这个稿子发出去,它是一个上下游的关系,所以在这种情况之下其实你会发现说设计师也好,设计师的参与感就比较差,而程序员的参与感就更差,他们根本不知道说我在这里面有什么价值,我就给人打下手的。导致了另外一件事情就是说在一个媒体机构里头,技术人其实定位是很低的,技术人员说实话过往在很多的传统媒体里面技术部门就干嘛的?就修电脑的、修网络的,刻光盘,所以没有成就感没有参与感,然后收入又不高,那我为什么还要呆在这儿呢?所以长期以往导致的情况就是什么呢?我们传统媒体的技术人员的水平特别低,很普遍的情况。然后真的等到你想干点什么事情的时候,你左想右想发现靠自己内部人根本实现不了,因为做不到。最后进入了一个死循环,每个人干不出来事情,就涉及到这种情况。 [2015-03-27 10:40]

    [黄志敏]第二的话,当我们如果把这几万人的位置坐标我们都放在一张表格里头,实际上我们什么都看不出来,所以我们必须把它放在这个图上面,我们用一个热力图的方式把表现表现出来, 那当你表现出来以后,大家会觉得很容易理解,所有人很看重,这是什么?这数据可视化,所以数据可视化的话,数据可视化是做大数据分析的一个很重要的手段。这也是导致很多人很容易把数据可视化跟大数据混在一起的原因。例如说大家有些时候会把大数据新闻跟数据新闻两个词混在一起,但实际上它不是一回事,数据新闻是把可视化的手段用在新闻的领域,而大数据新闻意味着你的这个资料的来源,你的这个结论是从这个大数据那里来的,所以它不是一回事,大数据新闻跟数据不是一回事,大数据和数据可靠也不是一回事。那么我们在2013年的时候我们看数据新闻这个领域,然后我们在2013年的10月份是组建了这个数据可视化实验室,这个数据话实验室有十个人左右,这十个人是跨部门的,是虚拟的实验室不是一个准确的行政划分,根据需要我们会去做不同的合作。 [2015-03-27 10:39]

    [黄志敏]那么我们都知道就是说去年12月31日的晚上这个时间最后这个地方是发生了一场悲剧,有很多人遇难。但实际上的话如果说我们能够用一些技术手段去管理的话,这种悲剧是可以避免的。其实我们看这张图,我们即使没有任何的解释我们也能理解,黑色的部分代表其实人口密度很低,黄色的部分一直到红色的部分到红色中间深色的部分代表人口密度越来越高。那么我们可以看到就是说在它的这个位置有一个白点,这写了几个字,陈毅广场,我们一看就知道这是人口密度最高的地方,也就是最后发生践踏的那个位置。这样一个图是从哪里来的呢?这个一个图根据手机信号来的,就是移动公司所谓运营商他拥有我们每一部手机的位置,它是知道的。那么误差不超过几米,只不过这个数据每个运营商他只拥有他自己用户的数据,那么假设说如果说我们是由政府部门出面然后跟这几个运营商都把这个数据要过来时实的监控的话,其实任何地方发生人流拥挤的情况是全部都可以时实看到的,那么这种悲剧就可以不用发生。那这个是什么?这张图里包含了什么东西呢?包含了好几万人的时实的位置坐标,这是什么?这是大数据的一部分。这其实是大数据的应用,这是第一。 [2015-03-27 10:36]

    [黄志敏]然后数据新闻我们又把它分为两种,一个是信息图,一个叫互动图表。信息图也很常见,过往我们在杂志、评媒里头其实见的是非常多的,包括我们在这个微博和手机上我们经常看到一张图给你讲清楚什么什么之类的,这个其实都是信息图。那么这个信息图也有一百多年的历史了。再有一个分类就是互动图表也是我今天要讲的重点。用计算机代码来用数据转换成一个图形来帮助大家更方便的去理解,那么这个就是所谓的互动图表。信息图靠什么人做,就靠做文案的人和啊靠做设计的人就可以做出来。而互动图表还要多一种人就是写代码,这是两个最大的区别。做互动图表必须有三种人组成,编辑、设计师和程序员。我们来看一个例子,当我们掏出一个手机的时候,打开一个地图的APP,这上面有多少数据可视化的东西呢?手机的信号有几格,wi-fi信号有几格,电池电量还有多少?这些都是数据可视化。包括整个地图本身也都数据可视化,其实我们每天没有意识到用了那么多数据可视化。比如地图上我们一看就知道,如果它划了一条红线就代表这个方向现在堵的厉害,如果画一条绿线说明很畅通,但实际上我们在路上看不到这样的线的,但是就因为我们经常看到这样的电子导航地图,已经变成我们的概念之意了。这里有两张图,这两张图是什么呢?右边这张图是去年12月31号晚上上海外滩的一个人口密度的热点图,而左边是一个时间表,我们都知道具体人口密度。 [2015-03-27 10:35]

    [黄志敏]然后像这边列举的5个APP都是我们自己的团队开发的,财新这边300多人,我们有30、40个人的技术对,那么是有比较强的研发实力的。我们的部门我们分为移动部、网站部、创意部还有一个数据可视化实验室。那么我们是投了10多个人的人手在移动方面,又投了10多个人在网站方面,我们通过这样去做这样一件事情。那么数据可视化的话,它其实有很多不同的描述和定义,那么有一种看法是这样的,就是说可视化,其实可视化是一个计算机科学方面的,或者说图形学方面的一个概念,那么它可以分为三块,其中的话第一块叫科学可视化,那什么是科学可视化呢?其实我们接触的很多,例如说地图就科学可视化,这个CT咱们到医院拍CT也是科学可视化,包括我们每天看的钟表也都科学可视化。第二个叫信息可视化,信息可视化其实也都非常常见,例如咱们在路边拍谁禁止停车这个就是很典型的信息可视化的一个标识。第三个叫可视化分析,可视化分析很典型例如说K线交易,我们把它整合到一起变成一个曲线体现成交量,最高价最低价等等,有经验的股民一看K线图对当天的股票的交易情况就已经有了很深刻的体会。所以这个其实K线图是可视化分析的一个很典型的一个例子。然后的话我们把这个可视化用在新闻领域的话,那么它就成了数据新闻。所以数据新闻是可视化在新闻领域的一个应用。 [2015-03-27 10:33]

    [黄志敏]那么有些就会奇怪,你们这么做的话你们是不是提前有知道什么东西?事实上的话我们不可能提前知道什么东西,当然谁都不知道。但是因为我们平时有做足够的准备工作,我们有我们的数据库,所以当一旦这个事情发生的时候我们能够迅速的从数据库里头把相关的资料调取出来然后迅速的组成稿件,所以我觉得这个就是把数据在我们工作里头的一个小的应用方面吧。  [2015-03-27 10:31]

    [黄志敏]然后杂志的话包括一个财新周刊,其他的还有一些英文刊。其实现在我们在新闻发布方面每天实际上有80%的内容是发表在网络上的。只有20%的原创内容是发表在纸媒上。基本上我们现在的做法是说当一个消息出来的时候,例如说某某人落马了,可能第一时间会发一个快讯,差不多十分钟之内我们会有一篇比较短的稿子大概在1千字以内叫我们称之为网稿会发到我们的网站上,基本上我们除了会说出这个人他的谁落马以后基本上我们会补上他的简历,还有可能会点出他落马的可能的主要原因。因为这种时候可能还没有正式公布,我们可能会有一些资料会公布出来。然后可能再过几个小时我们会上一篇稿子,我们俗称叫大稿,基本上我们会把一些相关的事实都展示出来给大家看。然后可能在过几天的话我们可能会有一个深度的调查报告发表出来。这种时候可能也会发布在网站上和纸媒上基本上是这么做。 [2015-03-27 10:29]

    [黄志敏]大家好我是黄志敏,来自财新传媒,那么财新传媒的话在过往的两年中,我们在数据新闻领域进行了一些探索和尝试。然后也取得了一点小的成绩。我今天过来把我们的一些经验体会分享给大家希望能有一些帮助。简单说一下财新传媒是作为一个财经的一个市场化媒体,那实际上当大家都还在讨论说要不要传统媒体要不要转型的时候,其实我们早已经走在媒体转型的路上,现在其实像财新传媒我们是主要有一个网站和四个杂志。那么所谓网站的话其他还包含了很多种的方式,包括有PC的网站,包括有手机的网站,包括工号,包括APP等有5个呈现的渠道。 [2015-03-27 10:28]

    [主持人]感谢崔院长,下面有请财新传媒首席技术官、财新数据可视化实验室负责人黄志敏作主旨报告,有请。  [2015-03-27 10:27]

    [崔保国]日经的成功,实际上日经卖了很多很多数据,不一定都是他的数据,大部分不是他自己的数据。但是他把数据卖的很好,就是因为他有一个非常诚信的品牌,再有一个他有鉴别这些数据可信不可信,专业不专业,分类不分类这样的一套机制。所以我觉得大数据时代,过去财经媒体走过的道路对我们今天也有非常深的参考意义的。还有其他的东西我就在这儿数据库是一个需要不断积累、不断发展的东西,最近我们和日经研究所也办了有十年了,我们也在做一个事情,日经还办了一个很好的杂志就叫"大数据杂志",我们也准备编译一部分杂志,或者是我们清华新创办了一个学术期刊叫全球传媒学刊,这个也是我负责的,我们也准备做一些大数据方面的研究和介绍。大数据这个杂志我们也有些合作,我们出来以后一个是非常愿意和大家分享、探讨,也欢迎大家关注,谢谢大家! [2015-03-27 10:26]

    [崔保国]另外一个数据产品也不是那么重要的。因为人人可以打造数据产品,那么最重要的是怎么进行数据产品的营销。那么最好的一条出路是什么呢?数据产品如果没有品牌的话,如果没有信用率的话,因为数据的最高的价值是它的信用,是这个数据可信它才有价值,才可用。那如果没有可信的保证的话再多的数据遍没有价值,我们现在的大数据就存在着一个非常重要的瓶颈就是怎么让它可信,谁来保证可信,日经给我们一个启示是什么呢?谁能保证可信呢?媒体能保证它的可信,媒体有一套确认事实的这样一个程序和这样的一套理论,还有这样的一套流程,还有它百年以上品牌的可信力。 [2015-03-27 10:24]

    [崔保国]总体上来讲它除了报纸事业部、出版事业部还有广播电视事业部,它的数字事业部是它的一个重要的业务部门。报业他们也是出现萎缩和衰落的,而且报纸的速度下降的速度在日本和中国报业下降的速度差不多,咱们叫断崖式衰退。未来媒体的出路在哪里呢?就是日经它有一个telecom21转型和传统数据产品的应用它算是做的非常好的一个典范。那么它同样的在大数据时代面临着一个挑战,过去的那些数据它也是从各个方面有的是购买数据,有的是代理数据,那么非常重要的是媒体的品牌来销售这些数据,这给我们一个启示。在大数据时代,实际上这些数据本身已经不是那么稀缺的资源了,是一个数据泛滥的时代,是一个数据过剩的时代。关键重要的是怎么样打造数据产品。 [2015-03-27 10:23]

    [崔保国]那么,财经媒体客户覆盖主要是银行、基金、还有保险公司这样的一些服务,这是它的界面,它的服务也遍及全世界。日本经济新闻可能离我们中国的市场产品和市场比较近,它就是叫Nikkei,它最重要的一个界面产品和入口是叫Nikkei,不是人民日报,参考消息发行多少万份呢?发行300万份,但是我们有13亿人口大家都知道参考消息。日本只有1.2亿人口,日经也发行300万份而且是个财经媒体,那就说明它的发行量很大了,而且它年销售额大概是大概是用人民币来算的话大概是将近200亿人民币。200亿人民币,咱们最大报业集团也就是30、40亿。电视有这么大的集团,那么它的业务里面现在已经有40%、30--40%都是为数据库产品来创造的价值。利润里面有一半来自数据库新媒体产品。所以它就算是在传统媒体转型到数据库里边它算是比较成功的一个例子了。 [2015-03-27 10:20]

    [崔保国]那么彭博的数据算是全球最具有专业水准的全球金融市场信息服务提供者。涵盖了股票、债券、外汇期货、货币等这些行情信息的分析等等相关。财经数据库给我们一个提示是什么呢?数据到处都有,但是真正能卖钱的一定是这个社会最具有刚性需求的,为什么我们所有媒体拥有这么大数据库,我们办了上百年的报纸纽约时报也好,泰晤士报也好,他们拥有大量的数据都可以扫进数据库,但是卖不出钱,什么样的东西能够把数据变成货币、变成产品呢?只有人民有刚性需求的,什么是最有刚性需求的?因为财经,财经是数据能变成钱的。买了有价值的信息需要人们付出钱付出代价来购买,所以这个是财经数据库能够成功的,至今为止成功的最大的数据库还有数据产品都是财经,这是它的一个特点。我们很多传统媒体的数据现在还没有大的成功的,包括纽约时报,包括日经,日经还有相当的成功。朝日新闻是世界上发行量最大的报纸,拥有这么大的读者,但是在数据方面还没有探索出成功的道路,这是一个世界的难题,也是大家世界共同关心的重大课题。 [2015-03-27 10:19]

    [崔保国]像扎克伯格前一段来清华也谈到,像Fcebook还有新的媒体,什么是大数据这些东西我就不再赘述了。我对大数据的理解。彭博公司就是布隆博格是一个值得研究和探讨的公司,现在来讲它是崛起最快,而且规模最大,而且现在也是在全世界数据库服务市场它还是数据服务咱们不要说数据库服务,仍然是最大的。现在大数据产品现在还都是小打小敲的,而且它的准确性,还有它的合法性、市场的可发展和可拓展,可持续的还有待探讨。比如说阿里巴巴拥有非常多数据,但是谁能用阿里巴巴的数据,阿里巴巴怎么来用自己的数据?这是一个非常复杂值得探讨的问题。 [2015-03-27 10:16]

    [崔保国]那么,大数据时代传统数据库的这些服务商也受到了很多的挑战。比如过去布隆博格很多生成是财经媒体,每一个财经媒体背后都有很大的数据库,在财经媒体界比较著名的数据库一个是路透社这是最老牌的,一个是布隆博格,还有一个叫邓白氏,大家不知道熟悉不熟悉,这是财经企业数据库。还有一个亚洲最大的是(日经米开)数据库。当然在咱们国内也有一些新的像新华信还有新的数据库,万德也都在产生新的数据库。那么在这方面我们确实是做了一些探索,但是今天也在面临着新的挑战,十多年前我们清华就和布隆博格建了一个布隆博格实验室,布隆博格给我们捐赠了10个数据库终端,这个数据库过去只有在大银行和大基金公司才会有这种数据库,一个终端一年的使用费大概就得几十万人民币,所以我们过去主要是用来培养国际化的财经媒体记者,他们怎么使用数据库来报道财经新闻,这是我们的一个项目。另外一个我们和日本经济新闻也建立了一个研究所,可以说对日经的整个亚洲和日本的包括中国的相当一部分的财经数据库,日经是做的最好的。 [2015-03-27 10:14]

    [崔保国]所以现在在世界大的传统数据库市场,我们可以把传统的数据库叫做结构化的数据库。今天大数据这个时代的到来,云计算新的计算到来对传统的结构化数据的市场也带来了挑战。对这种媒体也带来了挑战,同时给我们未来怎么使用大数据、怎么样把它变成一个可信的,可用的,又可以变成一个产业的市场也是一个崭新的挑战。我们不妨以我们过去对财经媒体数据库这样的一个研究和追踪可能对我们今天在大数据时代真正的把它创新成一种服务和产品也许是有参考意义和价值的。 [2015-03-27 10:11]

    [崔保国]非常感谢大会的邀请,本来是想来听伍刚老师来讲社科重大内容的发布的,后来要我也来讲一讲。其实我对大数据的研究也不深,和大家在这儿分享一下我倒是很长时间不是大数据时代在十多年前就一直在追踪数据库的研究,大数据时代数据产品和数据服务我们该怎么样来看,怎么来应用,我有一个思考,大数据确实是给我们带来了一个崭新的时代,在我们面临大数据如此的激动,如此的兴奋、如此的有很多想法的时候,其实我们更多的需要冷静,需要理性,因为无论数据有多大,确实现在数据是我们无法想象的大。但是它只有变成了产品以后才能够变成为社会服务、为人民服务这样的一种行业,或者是一种新的创新。那么,我觉得在过去,我今天想讲的话题是两个:一个是过去实际上数据成为一种媒体和成为一种产品不是从现在开始的,这种转变其实是从80年代开始,就是我们传统的媒体已经被许多大的数据媒体和数据产品所取代,这个最大的例子是两个:一个是路透社,一个是布隆博格的崛起。路透社在我们的印象里头是一个通讯社,但是在80年代到90年代的时候路透社90%的业务已经全部转成了数据库业务,它只有10%或者百分之十几的业务还是通讯社的业务,这个可能在我们视野里面因为是B2B的企业,不直接向消费者面对,所以我们过去可能对它不够了解。那么它已经占到了世界市场的大概是70%的市场,但是后来它被另外一个新崛起的叫布隆博格给打败了,他已经占领了世界的数据媒体产品的半壁江山。那么路透社抵抗补助了,他们后来路透社为了保持它在世界上这样一个份额,所以路透汤普森合并了,做了一个大的兼并。  [2015-03-27 10:10]

    [主持人]感谢陶教授,下面有请清华大学新闻与传播学院副院长、教授崔保国为我们做题为《财经数据媒体与大数据研究》的主旨报告  [2015-03-27 10:09]

    [陶丹]我要讲的第三个就是知名的大数据难题,这个就是讲的大数据这是中国信息研究院标准研究所副院长何宝宏他在一张文章上说了溅在沙滩上的大数据革命。因此就是讲的咱们现在成数据的这些介质非常非常的不可靠,你看硬盘才只有五年,硬盘只有五年的寿命,这个我远远体会到了,我买了好大储存量的硬盘数据全丢了,原来它就是一个保先性,里面我照的照片、信息全部都弄掉了。再有6盘只有8-10年,这位专家称我们的这个大数据是建在沙滩上的。这个相当于是人的身体健康,大数据储存相当是1,所有的相当于是0,1没有了这个大数据也就烟消云散,所以非常非常的重要。希望在座的领导们要提议大数据的储存这个工夫应该放在这儿,目前这个方向已经出来了,目前我建议基因储存是一个方向,用DNA储存、保存的时间可以达到数千年,咱们应该在这个上面下功夫。我相信咱们中国的能人是可以做出来的,因为这个已经有雏形了。再有还有人才的缺口,综合性的人才和具体的人才培养,我的时间到了,谢谢大家! [2015-03-27 10:04]

    [陶丹]从上面图可以看到互联网是由云加上网、加上端构成的。那么云是什么云呢?云是大数据和云计算,网是互联网和物联网还有工业4.0,端就是用户直接接触的移动设备像手机、还有不动设备像PC还有一般的电脑。 [2015-03-27 10:03]

    [陶丹]所以大家仔细看看这个图,它基本上按照网络术语来说这就叫做干货,一网打尽大数据的应用。网络+我稍微解释一下它最早是谁提出来的呢?是马化腾,马化腾是在一次发言上说的。他说网络+战略就是利用互联网平台、利用信息通讯技术这个地方我想的话是括弧大数据云计算,他说的是很具体的信息技术,我觉得大数据和云计算是叫做更宏大的眼光,这个地方加上这么一句。把户俩王和包括传统行业在内的各行各业联系起来,在新的临时领域创造新的生态。根据马化腾的表达这个网络+,这句话不是我这么说的,我忘了,这也是阿里的高级工程师解释他的话。网络+等于物联网加上工业4.0以及一切行业。我觉得还有一个我们传统的互联网和移动电信网都在这儿。  [2015-03-27 10:02]

    [陶丹]所以说健康大数据很重要。然后在应用方面它应该是三个方面的应用:第一网络的应用,第二综合应用。那么网络应用的话就是现在很流行的网络+、工业4.0、还有互联网,还有移动网,它是怎么用的呢?我是用的别人的一张图,我们看中间这个是云,云计算和大数据在中间,它为了表示它的重要以一个人头来表示这儿。那么我们现在用的这一块,这个来说的话就是这个网络连接是移动互联网。然后,这个中间的云和大数据它又连接着物联网和工业物联网,工业物联网它的名字也叫工业4.0。那么我们现在的网络+叫什么呢?物联网加上互联网这两个加起来,咱们总理已经说了已经把网络+的概念提出来了,这块就是网络+,这块是云计算和大数据。这个叫做一会儿我再讲网络+的具体成分再解释他们。 [2015-03-27 10:00]

    [陶丹]刚才讲的应用第一个是健康大数据,健康大数据我们可以看到,这是一个受瞩目的应用领域的调研队伍。第一个,2013年、2014年、2015年都是对大数据进行调研,都是受欢迎的主题。你们看看每一个主题里面都离不开"健康",健康医疗大数据,所以说只要人不死健康医疗的大数据它是伴随人的终身,它是会永远的活下去的。 [2015-03-27 09:59]

    [陶丹]我就要讲四个方面:第一全面的认识大数据,第二必须面对知名的大数据难题;第三个就是人才的问题;我们应该全面的梳理对大数据的认识,为大数据驱动咱们中国信息社会创新强国、战略提出可行的参考和建议。这也是我们此项目的一个很长的题目;首先我们要知道我们现在对大数据的认识停留在哪里?我们现在对大数据的认识大家都知道4个V,大、快、杂和全是连在一起的,再一个价值密度低。再还有就是大数据的预测功能,大家经常在用的,还有大数据用数据说话。这个都派生出来了很多很多成功的应用,我就不展开了。  [2015-03-27 09:52]

    [陶丹]除了技术这一块应用的话我把它归成两个方面,第一人本身的应用,本身的应用就是说你戴一个叫做传感器、你自身的叫做健康大数据,你的心跳、你有没有血压高、血稠不稠,你什么时候发病它都可以用大数据来预测和预防,这是人自身的大数据。除了人自身的大数据以外,其余的都是人在这个社会当中为人服务的大数据,所以它实际上就两个方面。人才培养这一块基本上是空白,所以我们今天由咱们社科办项目组的专家在。刚才理论上已经讲了,第一个是理论,健康大数据我刚才说了。 [2015-03-27 09:56]

    [陶丹]我个人认为光停留在特点上面远远就不够了,因为我们现在的工业4.0、互联网+还有物联网都出来了,大数据的面貌显的更复杂了,我们要从4个面全面的认识大数据。就像盲人摸象那样,原来大数据刚出来的时候我们每个人摸着它的一部分,有的摸着腿、有的摸着眼睛。现在随着大数据慢慢的应用广泛、应用成熟我们也随着,我们想站在大象的上方低头看看大象是什么样子,那么四个特点是完全说明不了大象的样子的。所以要扩大到四个面。哪四个面应该来说最主要的就三个面:理论、技术和应用。包括我们今天的发言都可以归在这个大的这张图里面。它的理论是定义、特点、历史、学术研究,其实我觉得还可以把它浓缩一下,历史也是在学术研究里面,然后它的技术、技术这一块首先是云计算,云计算出来了,有了云才有大数据的应用。云和大数据它是分不开的。那么大数据上面最主要的是分布式处理平台,分布式处理平台用的最成熟的是Hadoop软件,这个是比较成熟,现在还有什么(黑马)都出来了,但是我问了一下淘宝,有一些大数据处理公司的话他们经常用的还是现在的分布式软件也比较,慢慢在往前走。还有成熟技术,还有感知技术。 [2015-03-27 09:54]

    [主持人]感谢各位领导的精彩致辞,为我们展现了一幅大数据浪潮席卷下的时代图卷。接下来我们将进行国家社科基金重大项目网络文化建设"大数据与媒介创新研究协作联盟"启动仪式。为深入贯彻落实人才强国战略,建立校企合作人才培养模式,缩短毕业生从学校走向社会的适应期,实现学校成为企业人才培养摇篮、企业成为学生实习就业基地的双赢目标,中央人民广播电台央广网与各学校达成协议,向学校学生提供实习岗位等事宜真诚合作。现在有请北京大学新媒体研究院研究员赵恺、清华大学大数据产业联合会秘书长王霞、中国人民大学高礼研究院执行院长卢斌 、中国人民大学新闻学院院长助理赵云泽、中国社会科学院世界传媒研究中心主任姜飞、河北大学新闻传播学院院长白贵、中国青年政治学院新闻传播学院执行院长罗自文、北京电影学院中国电影产业研究院执行院长吴曼芳、北京师范大学学术委员会副主任李晓西教授代表宋涛、北京邮电大学互联网治理与法律研究中心谢明敦、东北师范大学传媒学院院长助理鲍枫、山东师范大学文学院副院长、新闻系主任常庆、缔元信.网络数据CEO秦雯、中央人民广播电台央广网副总编辑伍刚上台签约。希望通过我们共同的努力创新人才培养模式,让高校媒体企业合作成为新常态!那么,大数据在各行各业到底带来了哪些切实的改变?接下来的主旨报告环节相信一定会让您脑洞大开!首先,有请河北大学新闻传播学院教授、博士生导师 陶丹上台作主旨报告,题目《大数据引发的思维变革》。 [2015-03-27 09:50]

    [白贵]例如,大数据环境下数据新闻提升了新闻的交互性,交互性能与传播效果,延展了新闻的时间和兼容度,提高新闻有效路径传播的精准性,促使新闻在宏观叙事与微观叙事等传播形式的融会贯通。促进大数据研究方法在新闻传播学中应用。面对历史与现实,变革与坚守、转型与融合传媒人、传媒行业、传媒教育都将发生巨大的变革。在这场变革中期待我们传媒学界和业界都能积极而理性,从容而顺势,顺思而笃行。预祝各位会议期间各项活动顺利,谢谢大家! [2015-03-27 09:49]

    [白贵]

    尊敬的各位专家、学者、各位来宾、女士们、先生们上午好。很高兴我们能在这里相聚、相聚到国家社科基金重大项目网络文化建设研究暨首届大数据时代创新与媒介变革研讨会的会场,大数据时代传统的新闻业态发生了深刻的变化,在信息生产层、整合提供层、融合传播层和用户使用层等整个媒介生态的众多环节都发生了巨大变革。大数据信息背景下作为大数据与新闻传媒业的结合落地点数据新闻应运而生了。在传统媒体面对网络媒体的众多挑战而四面楚歌时,借助大数据的信息环境、充分分析挖掘数据,正在成就着数据新闻实践的创新。数据新闻让卫报的主编、英国著名报人、政治家、司各特的名言"事实是神圣的,让数据说话,再度复活。"国际咨询业大老麦肯锡公司关于大数据对各行业潜力的预测也让众媒体聚焦。全球知名智库(高科那)公司的技术炒作周期图,对新闻与传播学同样具有启发意味,国家业界代表人物关于数据新闻制作工程的观点与业界当前的数据新闻事件,要让数据新闻展现出诱人的想象空间和乐观前景。河北大学数据新闻研究硕士课程针对性研究发现,数据新闻的制作过程有规律可寻,犹如传统新闻学中的金字塔模式,有学者将其归纳为新闻主题发现,数据抓取、清晰过滤、分析挖掘,交互化设计、可视化呈现、故事化讲述。其余核心是数据处理、交互化设计、场景化设计与可视化呈现。梳理数据新闻实践的发现,数据新闻带给传统新闻传媒业的影响是多方面的,它甚至引发了一些重要的理论思考。
     [2015-03-27 09:48]

    [主持人]非常感谢卢院长,下面有请河北大学新闻传播学院院长、教授、博士生导师 白贵致辞。 [2015-03-27 09:47]

    [卢斌]说说新媒体的变革如何形成自己的护城河,我认为人心是最大的战场,人性是最大的金矿。抓住了人的最基本的需求,就是说不仅你要看大数据的时候,不仅要看你的受众,当成你的合作伙伴要相互看,比如说我们央广你去跟一个医院去谈合作,肯定是他认为你有这个品牌,你是代表了国家。大家知道分别代表了如果说是微信代表了人与人的联合,电商代表了人与商品的联合,百度代表了人与信息的联合他们都在进行深刻变革。李彦宏在2014年春节年度总结会上我作为专家去参加,百度不再是信息的联合,是人与服务的联合。他指着北大口腔医院说,我们的信息一定要做到每个大夫都能上线,通过百度就能够去预约,这件事情大家知道EBT都在做。为什么就是说我们传统的媒体有自己非常好的品牌资产,不能把这项资源更好的连接起来,为你的听众服务,而为什么还要仅仅的挡住频道建设这个一个思路呢?我希望能看到就是说对传统媒体,也有他们自身的优势,能够整合更多的社会优质资源分享给过去所谓的受众现在是你的合作伙伴。实际上媒体的变革是一直进行当中的,天下武功唯快不破,变化是永恒的,世界发展的规律就是小的公司一定会吃掉大的公司,慢慢变大。大的总想做成永恒的,而永恒是不可能的。所以说在这样一个时代就是说我认为颠覆性创新是必然存在的,早死早超生,如果传统媒体必须有向死而生凤凰涅盘的那种勇气和力量,才能在这个大数据时代获得新的发展。谢谢大家!  [2015-03-27 09:40]

    [卢斌]传统媒体就是有牌照资源,资金优势、专业队伍和物理网络。这几个优势对传统创新的清新小媒体而言都不具备,因为你的牌照会被别人利用。包括乐视,他也是没有牌照的,他利用了我们在座的各大媒体他们发展起来了。资金他们是利用社会资源,队伍很小,就是50人改变世界。网络没有这样高大上的大楼大厦,完全轻资产,可以不考虑所有的这些,这些资源用的好是资源,用的不好是包袱。再一个从资质上来看人民网已经走到上市了,非常好。其他的传统媒体的平台还在继续努力当中。上市是不是一定是目标,要根据当时的时空环境还有资本环境来看。你这个媒体要去变革谁来去做你这个平台的一把手,协调资源的深度是怎么样的?那么大部分的情况下,我们都知道副级以上的领导三五年一换,这些关键的策略是不是具备长远性?深刻性和系统性,我觉得都值得深刻的思考的。但是小媒体不一样,至少我要控股的话我要占40%以上,相当于把我的青春、身家都压到这个平台上,这个平台发展的所有权和管理权分离的状态下发展速度是不一样的。 [2015-03-27 09:38]

    [卢斌]这种融合怎么去把握,我觉得看两个关键的指标。第一个你的新媒体,假如说以副部级以上的新闻单位来看的话,就是你的新媒体从业的人数占你整个的平台的总的人数是多少?第二个看你新媒体的收入占你整个媒体的收入是多少?如果这两个指标在不断的增长,我觉得那是没有问题的。如果这两个指标低于业界的平均水平那真的要重新考虑一下,你在大数据时代的媒体的变革的策略是否是正确的。 [2015-03-27 09:37]

    [卢斌]为什么这么说呢?在以摄像机、照相机、采编平台为代表的高大上的信息生产的工具稀缺的年代在今天一部手机、一个ipad就可以轻松的消除掉。当然从你专业人士来讲你的信息、权威性远远不够,但是老百姓真正需要那么高质量的图片和即时的信息吗?譬如说前天发生的北京的地铁出轨的事件,主流媒体没有一家报道的,但是在微信里面是全面的图片,这个说明什么问题呢?就是说受众已经变成了你的竞争者。一定意义上它就是真正的信息的生产者。今天可以这么讲,在央广平台上来讲逻辑思维一个人一间十平米的小房子,每天早晨发一分钟的语音有多少人呢?每天最新数据260万粉丝,每天活跃粉丝数接近40万,去年的销售额一个亿,团队它的核心的团队只有三四个人,因为他的创始人就两三个人,最早的创始人退出之后现在就剩两个人了。其他的所谓的团队相当一部分是大学生。这是什么样的生产效率。我们高礼资本就是说,包括高礼研究院做了接近四年,高礼资本做了十年。我们投资的这个平台,我们最近就是说基本上把全国的大的自媒体平台全部梳理了一遍,重金买入了他们的股份,我们认为小而灵的新媒体真正机遇大数据的我们认为它是更有发展前途的。传统媒体实际上我认为没有一个变革与非变革,一直都在融合之中。 [2015-03-27 09:36]

    [卢斌]在这儿我可以谈我的观点,为什么拒绝了这个,你想,8.5亿在账上躺了三年还没有花出去,说明什么呢?说明传统媒体后面的利益是极其复杂的,决策的这个链条是非常长的,难道因为我是人民大学,即使是北大、清华、斯坦福来了就能把这个8.5亿的研究资金就能操纵吗?不可能的。一千万过来什么样的评估机制,国资的应该进来了,我的独立性节会失去,所以这个钱我也不能要。所以大数据媒体的变革大家往往看起来一想是三五亿空间的事情,就是说在今天这个时代这个结点上,我们在北京的广电大厦这样具有深厚的国企背景里面讨论一个内容,从内容到传播三个纬度,实际上我觉得大家可能讨论更多的大数据主要是人群的深度,实际上是一个从时间纬度、地理纬度加了一个人群的深度。还有一点就是变革的速度,在我看来大数据变革是有五度空间的。传统媒体就是说读者、听众、观众、实际上用一个词来概括就是受众,这个词是不是准确?在今天而言,我想既然要做变革,不如从更深刻的角度去考虑,所谓的自媒体。你那个受众总是从广场论去看,说大喇叭、电视一播,然后我就能影响他们,实际上你总想抓住,拧住他们的耳朵,抓住他们的眼球这个在新媒体时代已经是远远不够了。为什么呢?因为技术的发展已经撵平了专业化的分工,以央视或者是以他的高大上的演播室为代表的信息生产中心控制能力在今天的话还跟过去20年相比它对社会影响力还是不是这么大,我认为它已经大大的降低了。 [2015-03-27 09:33]

    [卢斌]讲一个故事,就是在两周之前我去一家副部级的新闻媒体,他请我去让我帮他咨询做一个经济大数据的一个产品,那么他的负责人告诉我说,我有财政部拨款8.5亿,我给高礼研究院我们签定协议给你一千万第一年帮我做产品开发你觉得怎么样?大家能想到这个结果吧?我就是说很早做出决定这个没法合作,真的说时间精力的问题,不能合作,就是说高礼学校有自己的事情。你想一千万,而且要签的很大,人名作用,有陈雨露校长,中国最年轻的大学校长来牵头做这个肯定是有信心的,我们能把这个产品做出来,我们这个产品要跟彭博社的客户终端去打拼,要跟万德数据把他们干掉,一个是外资的,一个是我们中资现在已经上市。应该是大数据产品,我想这家新闻单位有这个实力,无论物理的,地区的网络还是生产能力各方面看起来都没有问题,作为一个大学的研究机构,资金对我们来说是非常紧缺的,为什么我拒绝了?这个下面我会谈到的就是我的一些观点就是说在这个大数据的时代你到底想要什么?传统媒体怎么去变革,我想这个故事我会有我自己的观点。 [2015-03-27 09:32]

    [卢斌]现在微信的国际化除了大众化区国际推广是由高礼资本扎克伯格的Facebook、印尼的(英)和高礼四家成立的平台,在全球进行推广。那么也就是说微信是我们国家除了华为之外走向国际的应该说是以软件为载体的以社交工具这样一个面目出现的第一个产品是国家级战略。所以说当代20个月之前讨论微信是否能生存下去的时候,我作为战略的多次会议的参与者,我们知道它一定是国家的支持的,发展起来的。介绍了高礼研究院现在是一种什么样的,为什么能站在这个讲台上跟大家汇报一下发展长久,高礼研究院学位项目我们在校生大概有100多人,非学位项目加上校友有500多人,分布在全球的顶级名校,就从名气的学校上来讲都有我们的学生,从哈佛一直到牛津、剑桥、耶鲁、斯坦福,他分布在全国,在北京的话,从中关村到金融街,基本上都有我们的学生,这是我们过去三年的发展。 [2015-03-27 09:30]

    [卢斌]各位领导、同学们、老师们大家上午好。既然是大数据时代背景下的媒体的创新,媒体的创新,我想媒体是什么?上来先有一个广告,做一分钟广告讲一个故事,谈两三个观点。因为广告到底研究院是干什么的,中国人民大学通过财经、新闻、法律,高礼是怎么成立的,2011年的时候,北京大学张院士向人民大学捐助了2千万人民币,由人民大学和耶鲁大学斯坦福、哈佛共同成立了一个高端的平台,就是我们现在的高礼研究院。中国人人往高处走,这是高,礼就是礼仪之邦。那么同时在160年前进入中国的第一个大学就是耶鲁大学它叫雅礼大学,它的来源就这样。我们期望培养中西结合的顶端人才。高礼研究院成立三年以来过去几年我们都是默默无闻的耕耘这个平台建设,我们的学生是来自人大、北大、清华三个学校最顶端的学校的学生,全额奖学金,其中有这么几个项目,其中有斯坦福、耶鲁等等,关注我的和人民大学官方的网站、官微,每年二十名到五十名,每年提供三个项目有去美国的暑期学校,同时我们今年中国人民大学的互联网金融大家知道是今年最热的一个词。在政府工作报告当中出现了很多次,那么这个互联网金融的这个学科和人才培养本硕博的平台打通就在高礼研究院。那么高礼研究院的管理结构这样,是由陈雨露校长亲自任名誉理事长,由人民大学的常务副校长、著名的法学泰斗研究生院院长王立明校长兼任我们这个校长,我是执行校长,所有事情都是我来做,未来马上就是再请香港的首任特首董建华先生过来兼任名誉院长和耶鲁大学的校长。我们的资源确实是世界比较顶端的,我们做什么事情呢?一个是建设中国人民大学的大数据实验室已经启动了,在五一前后可以去观摩,我们整合了院内的资源。高礼研究院的资源是什么呢?京东上市是高礼研究院的投资公司整合了微信和京东的数据资源共同来建设了,整个上市高礼资本是最大的市场,这在公开市场可以查到。 [2015-03-27 09:28]

    [主持人]感谢官总,下面有请中国人民大学高礼研究院执行院长卢斌致辞。 [2015-03-27 09:27]

    [官建文]对于媒体来说创新太重要了,变革太重要了,关系到媒体的强壮、关系到媒体的存亡,关系到媒体的未来。所以我们说今天这个研讨会很及时、很重要,相信各位专家、学者会在今天的会上提出很有价值的建议和方案。祝研讨会圆满成功!  [2015-03-27 09:23]

    [官建文]那么去年以来我们明显的感觉到传统媒体从领导到编辑记者他们的危机感更强了,忧虑加深了,随之而来的是创新意识更强了,对新媒体投入更大人力物力的不仅是他们,像我们这样的网络媒体也一样有了强烈的危机感。因为相对于媒体来说我们网络媒体已经是传统媒体,大数据时代真正的大数据时代我觉得还没有到来,现在我们最多是站在了它的门口。相对于未来现在这个数据量和数据处理的技术都还是比较初级的。但是,未雨绸缪很有必要,在真正大数据时代来临的时候,我们这个媒体可能遇到的困难、得到的机遇比现在都大得多。说困难主要是生存困难,不创新、不变革、不适应时代,媒体可能活不到大数据时代了。说机遇,如果媒体抓住到机遇,迎难而上,抢占制高点,在大数据时代将会变得非常强大。它不仅是信息传播者而且是信息处理者,数据处理者,是这个处理的综合体。而且还可能变身为对企业、对社会、对决策者能够提供对策建议,提供解决方案的智库。 [2015-03-27 09:22]

    [官建文]尊敬的各位领导、各位专家、各位朋友,大家上午好。大数据时代的创新和媒体变革这个研讨会我觉得挺好,很值得研究。为什么呢?因为现在我们这个媒体正处在一个变动的、正在重构的一个时代,曾经稳定了几十年甚至上百年的传播格局、传播方式、传播形态正在被打破。新的传播方式和新的传播形态在不断的产生。有人说传统媒体时代是在信息稀缺、信息匮乏的条件下来做传播,现在我们是在信息冗余、信息泛滥的时代来做传播,这是有一定道理的。原来讲信息稀缺既是指我们媒体去采集信息的困难和我们获得的信息有限,我们发布的有限,也是指大众从我们媒体、从其他渠道获得的信息也是相对稀少的。那么现在说信息冗余、信息泛滥一个是我们媒体面对大量的信息源,我们面临选择困难。再一个大众,除了我们媒体大量的信息还有各种渠道的信息,他们面临着一个看谁的、听谁的、信谁的也面临一个选择困难。在这样的情况下,媒体尤其需要创新、需要变革。今年这个两会我们说是盛会,这个盛会既是政治上的,另外一方面也是我们媒体一个创新的盛会。从各地的地方两会到全国的两会,我们看到今年的媒体采取了很多方式,通过这一基础的报纸、广播、电视,新增了微博、微信客户端,还有二维码,还有H5,不仅是省报、省的电视台、电台参加全国两会的地方报纸也是这样,把"两为一端"作为他们的标配,从人员配置上来看我问了一下有的省报成立新媒体部,这个新媒体部十几个人,我就问其他的专业部多少人,那些科教部、经济部都是几个人不到十个人,所以从人员配置上来看也在加强。 [2015-03-27 09:20]

    [姜海清]各位来宾、各位朋友、先生们、女士们:上午好!首先,感谢各位朋友们的到来。大数据时代已向我们走来,它将如何改变我们的社会生活?对全球网络空间治理、各国政府管理、新闻传播格局与媒介生态、数字公民个人生活将产生怎样深刻的影响?今天,由中央人民广播电台承担"国家社科基金重大项目--网络文化建设研究"课题组在此举办《首届大数据时代创新与媒体变革研讨会》。我们相聚在这里,共同研讨大数据时代的创新与变革。当前,在大数据与信息过剩的风险社会,传统的新闻业态将在大数据时代发生深刻的变化。大数据将在生产信息提供者层面、媒体层面和用户层面对新闻业态产生深刻的变化,针对信息时代的社会化媒体发展和变革,我们将如何迎接大数据时代的变革与创新?大数据正在改变媒体的传统传播形式,新媒体传播呈现数据化、社群化、个性化等特点,这些特点在大数据开发的背景下进一步凸显,并出现了许多新变化。新媒体终端及其承载的内容以"数据"为基础,为受众呈献丰富详尽、言简意赅的信息,提供大众的、或个性的服务。为此,本次研讨会根据不同议题,设置大数据时代的媒介产业、大数据时代的版权管理、大数据时代技术、大数据时代的青年媒体人成长等系列论坛,让各位从不同领域、不同角度深入的解读大数据为人们生活、各行各业带来的改变。在媒体融合的大背景下,中央人民广播电台作为传统媒体,正在迎来全媒体转身。我们深知,大数据的发展必将影响新媒体的发展,大数据成为新媒体发展的基础。借此契机,我们将探索一条传统媒体与新兴媒体相互融合、共赢发展的新途径。最后,祝本次研讨会圆满成功,再次向前来参加本次会议的各位来宾、朋友们表示热烈的欢迎和衷心的感谢!谢谢大家! [2015-03-27 09:15]

    [主持人]中央网络安全与信息化领导小组办公室、国家互联网信息办公室网络信息传播局副局长汪祥荣:国家新闻出版广电总局网络视听节目管理司副司长董年初:国家社科基金办公室副主任赵川东:中央人民广播电台副总编辑姜海清: 人民网副总裁官建文:清华大学新闻与传播学院教授、副院长崔保国:北京大学新媒体研究院研究员赵恺:中国人民大学高礼研究院院长卢斌:河北大学新闻传播学院院长、教授白贵:中国青年政治学院新闻传播学院执行院长罗自文: 清华大学大数据产业联合会秘书长王霞:中国社会科学院世界传媒研究中心主任研究员姜飞:缔元信.网络数据CEO秦雯:感谢各位,下面有请中央人民广播电台副总编辑姜海清为大家致辞! [2015-03-27 09:13]

    [主持人]尊敬的各位领导、各位来宾,大家上午好:我是央广网主持人马惠,很高兴和大家分享这场创新的盛宴。创新科技改变世界,信息数据引领时代潮流。近年来,大数据这个原本陌生的专业词汇迅速进入大众视野,掀起了一场新的数据技术革命。大数据正在改变我们的生产、生活、教育、思维等诸多领域以及认识、理解世界的方式。今天我们举办 "2015·首届大数据时代创新与媒介变革"研讨会,围绕大数据时代全球网络文化发展趋势,探讨媒介创新发展未来。下面由我向大家介绍今天到场的领导和嘉宾:  [2015-03-27 08:52]

    周庆山

    北京大学信息管理系教授

    信息管理领域研究方法的大数据应用

    周庆山表示,大数据是一个虚无缥缈的东西,只听说没见过。其实,大数据的应用较多在公共治理方面,比如用大数据整治交通的问题、公共卫生的问题、订票系统等。[详细]

    匡文波

    中国人民大学教授匡文波

    智能手表将成为最具市场潜力领域

    匡文波认为,智能手表将成为最具市场潜力领域。未来的十年左右,我们所熟悉计算机的形态,包括台式机、笔记本、平板电脑都会被淘汰掉。[详细]

    黄志敏

    财新传媒首席技术官

    数据可视化是大数据分析的重要手段

    黄志敏表示,数据可视化其实有很多不同的描述和定义。可视化是一个计算机科学方面的,或者图形学方面的概念,可以分为三块。[详细]

    崔保国

    清华大学新闻与传播学院副院长

    面对大数据更应冷静理性

    崔保国说,大数据确实是给我们带来了一个崭新的时代,在我们面临大数据如此激动,有很多想法的时候,其实我们更需要冷静、需要理性。[详细]

    陶丹

    河北大学新闻传播学院教授

    解读复杂大数据:从三个方面认识

    陶丹认为,大数据的面貌显得更复杂了,我们要从最主要的三个面认识:理论、技术和应用。[详细]

    王立新

    北京邮电大学教授

    信息化能够实现智能化匹配

    王立新认为信息化最为重要的是,能够通过IT技术的进步,使供需双方的信息实现成本接近于零的精准智能化匹配。[详细]

    付玉辉:把握大数据平衡非常重要

    中国联通集团新闻宣传处副处长付玉辉在论坛中表示,大数据处于初步探索的阶段,在使用大数据的同时,怎么把握大数据中一些需要平衡的问题非常重要。对于企业来说,成立数据中心,对全集团分布在各个分公司的数据进行采集,同时建立大数据的管理平台。未来,大数据平台能够为社会提供基于大数据的服务。

    付玉辉

    褚家炜:大数据对于媒体是一个好时代

    大数据时代对于媒体来说是一个好的时代,中央媒体面临的压力也会非常大。在2013年前后,国内的一家门户网站实行的门户、微博、视频、无线端的整合,网站全面延展,褚家炜认为,这背后的支撑没有大数据是达不到的。

    褚家炜

    吴昊:信息不对称是信贷行业主要问题

    在大数据时代技术论坛上,好贷网大数据事业部总经理吴昊表示,在信贷行业,信息不对称是主要问题。

    吴昊

    郑铁男:数字出版就是出版加上互联网

    一直从事于数字出版和互联网行业的郑铁男表示,互联网数字出版等于互联网,一个APP客户端的列表,对整个阅读进行了分支,社交、阅读、个性化服务都包含在内。借助于此,郑铁男将创办的翻书网1.6个亿卖给百度,所以数字出版,就是出版加上互联网。

    郑铁男

    崔保国:面对大数据更需理性

        大数据确实是给我们带来了一个崭新的时代,在我们面临大数据如此激动,有很多想法的时候,其实我们更需要冷静、需要理性。无论数据有多大,只有变成了产品以后才能够变成为社会服务、为人民服务这样的一种行业,或者是一种新的创新。

    官建文:创新关系到媒体的存亡

        官建文强调创新的重要性,他认为,这关系到媒体的强壮、关系到媒体的存亡,关系到媒体的未来。

    新闻热线:400-800-0088 E-mail:4008000088@cnr.cn
    违法和不良信息举报电话:010-56807188
    中央人民广播电台介绍 | 央广网介绍 版权所有(C)