央广网

教育频道 > 教育频道专题 > 首届大数据时代创新与媒介变革研讨会 > 要闻

央广网

黄志敏:数据可视化是大数据分析的重要手段

2015-03-27 12:38:00 来源:央广网

   

  央广网北京327日消息 327日,由中央人民广播电台新媒体宣传中心、河北大学新闻传播学院、中国社会科学院世界传媒研究中心、中国科技新闻学会网络媒体专业委员会共同主办的“首届大数据时代创新与媒体变革研讨会”在京举行,本次研讨会以“时代创新 媒介变革”为主题,围绕大数据时代全球网络文化发展趋势,探讨全球媒介创新发展未来。网络文化建设和管理部门、科研院校、国家核心学术期刊负责人、专家、学者共200人出席会议。

  财新传媒首席技术官、财新数据可视化实验室负责人黄志敏在研讨会上作主旨报告。他表示,数据可视化其实有很多不同的描述和定义。可视化是一个计算机科学方面的,或者图形学方面的概念,可以分为三块。其中第一块叫科学可视化,例如地图、医院的CT、钟表都是科学可视化。第二块是信息可视化,例如路边拍违反交规就是很典型的标识。第三块是可视化分析,例如K线交易,一个曲线体现成交量,最高价最低价等等。当把可视化用在新闻领域的话,就成了数据新闻。所以数据新闻是可视化在新闻领域的一个应用。

  黄志敏表示,数据新闻分为两种,一个是信息图,一个叫互动图表。如果说信息图靠做设计的人就可以做出来,那么互动图表还要写代码,比如手机地图、手机信号、wifi、电量等。当地图上划了一条红线时,就代表这个方向现在堵车厉害,如果画一条绿线说明很畅通,但实际上我们在路上看不到这样的线的。

  数据可视化是做大数据分析的一个很重要的手段。这也是导致很多人很容易把数据可视化跟大数据混在一起的原因。他举例说,数据新闻是把可视化的手段用在新闻领域,而大数据新闻意味着这个资料的来源、结论是从这个大数据那里来的,大数据新闻跟数据不是一回事,大数据和数据可靠也不是一回事。

  以下为文字实录:

  当大家都还在讨论传统媒体要不要转型的时候,其实我们早已经走在媒体转型的路上,现在其实像财新传媒我们是主要有一个网站和四个杂志。那么所谓网站的话其他还包含了很多种的方式,包括有PC的网站,包括有手机的网站,包括工号,包括APP等有5个呈现的渠道。

  杂志的话包括一个财新周刊,其他的还有杂志还有一些英文刊。现在我们在新闻发布方面每天实际上有80%的内容是发表在网络上的。只有20%的原创内容是发表在纸媒上。我们平时有做足够的准备工作,我们有我们的数据库,所以当一旦紧急事件、重大事件发生的时候我们能够迅速的从数据库里头把相关的资料调取出来然后迅速的组成稿件,所以我觉得这个就是我们在把数据在我们的工作里头的一个小的一个应用方面吧。

  5APP都是我们自己的团队开发的,财新300多人,我们有3040个人的技术队,是有比较强的研发实力的。部门分为移动部、网站部、创意部还有一个数据可视化实验室。投了10多个人的人手在移动方面,又投了10多个人在网站方面,去做这样一件事情。数据可视化其实有很多不同的描述和定义,其实可视化是一个计算机科学方面的,或者说图形学方面的一个概念,那么它可以分为三块,其中的话第一块叫科学可视化,例如地图就科学可视化, CT也是科学可视化,包括钟表都是科学可视化。第二个叫信息可视化,信息可视化其实也都非常常见,例如路边拍谁禁止停车这个就是很典型的信息可视化的一个标识。第三个叫可视化分析,可视化分析很典型例如说K线交易,我们把它整合到一起变成一个曲线体现成交量,最高价最低价等等,有经验的股民一看K线图对当天的股票的交易情况就已经有了很深刻的体会。所以这个其实K线图是可视化分析的一个很典型的一个例子。我们把这个可视化用在新闻领域的话,那么它就成了数据新闻。所以数据新闻是可视化在新闻领域的一个应用。

  数据新闻我们又分为两种,一个是信息图,一个叫互动图表。信息图也很常见,过往我们在杂志、评媒里头其实见的是非常多的,包括我们在这个微博和手机上经常看到一张图“给你讲清楚**”,这个其实都是信息图。信息图有一百多年的历史了。再有一个分类就是互动图表也是我今天要讲的重点。用计算机代码来用数据转换成一个图形来帮助大家更方便的去理解,那么这个就是所谓的互动图表。信息图靠做设计的人就可以做出来,而互动图表还要写代码,这是两个最大的区别。做互动图表必须有三种人组成,编辑、设计师和程序员。我们来看一个例子,当我们掏出一个手机的时候,打开一个地图的APP,这上面有多少数据可视化的东西呢?手机的信号有几格,wi-fi信号有几格,电池电量还有多少?这些都是数据可视化。包括整个地图本身也都数据可视化,其实我们每天没有意识到用了那么多数据可视化。比如地图上我们一看就知道,如果它划了一条红线就代表这个方向现在堵的厉害,如果画一条绿线说明很畅通,但实际上我们在路上看不到这样的线的,但是就因为我们经常看到这样的电子导航地图,已经变成我们的概念之意了。

  数据可视化是做大数据分析的一个很重要的手段。这也是导致很多人很容易把数据可视化跟大数据混在一起的原因。例如说大家有些时候会把大数据新闻跟数据新闻两个词混在一起,但实际上它不是一回事,数据新闻是把可视化的手段用在新闻的领域,而大数据新闻意味着你的这个资料的来源,你的这个结论是从这个大数据那里来的,所以它不是一回事,大数据新闻跟数据不是一回事,大数据和数据可靠也不是一回事。那么我们在2013年的时候我们看数据新闻这个领域,然后我们在2013年的10月份是组建了这个数据可视化实验室,这个数据话实验室有十个人左右,这十个人是跨部门的,是虚拟的实验室不是一个准确的行政划分,根据需要我们会去做不同的合作。

  这个实验室包括三种人,第一种是记者和编辑就做处理稿件的人。第二个是美术设计师,第三种是程序员,三种人组成了这个。那么做数据新闻的话其实对我们过往的整个新闻生产流程是有一个非常大的变化。什么样的变化呢?过往的新闻生产其实从文案到设计到技术其实是个上下游的关系。基本上稿子是谁定的,稿子是记者跟编辑定的,那么其他的人员设计师也好,技术也好在这个里面起的是什么,是支撑的作用,稿子出来了由美编去帮助配图再有技术人员把这个稿子发出去,它是一个上下游的关系,所以在这种情况之下其实你会发现说设计师也好,设计师的参与感就比较差,而程序员的参与感就更差,他们根本不知道说我在这里面有什么价值,我就给人打下手的。导致了另外一件事情就是说在一个媒体机构里头,技术人其实定位是很低的,技术人员说实话过往在很多的传统媒体里面技术部门就干嘛的?就修电脑的、修网络的,刻光盘,所以没有成就感没有参与感,然后收入又不高,那我为什么还要呆在这儿呢?所以长期以往导致的情况就是什么呢?我们传统媒体的技术人员的水平特别低,很普遍的情况。然后真的等到你想干点什么事情的时候,你左想右想发现靠自己内部人根本实现不了,因为做不到。最后进入了一个死循环,每个人干不出来事情,就涉及到这种情况。

  做数据新闻就不一样了,数据新闻整个生产流程要变为什么呢?当我做数据新闻的时候一个选题定下来,第一个要看它有没有足够的数据,如果说没有数据的话这事没法干。第一个有数据以后大家三伙人坐在一块商量说,我们这个数据新闻用什么样的形势去表现会比较好看。然后大家都觉得好看,这个时候程序员就得跑出来那如果比较好看的话,这个我开发看能不能实现,成本高不高,时间赶不赶得急。如果发现说开发上不可承受的话,我们还得倒回去,修改这个设计方案。那么它本身就是一个互动的过程,等到这个方案确定了,等确定以后我们可能反过来我们得去倒推,推回去得跟记者说不行,数据不够,你再给我补些数据过来。做数据新闻跟原来我们做,我一般写稿件为例跟稿件是不一样的。像处理稿件的话,因为它用了篇幅的限制,题材的限制,所以有些时候只需要抽取一些典型的例子。所以做数据新闻的话反过来有些时候不能被动的等着记者去提供,反过来我要要求记者和编辑去提供更多的内容,这个是我们做数据新闻的情况。

  比如,像6万字的报道非常好,有很多人非常耐心的看。但是它的阅读量从前往后是递减的,因为现在有很多人他没有很多耐心很这么多,也不一定了解这件事情。一下就有一个很直观的感受,所以这个就是数据新闻的魅力和价值。按那么讲到这里的话,我还要讲渠道的问题。我们现在传统媒体,其实出现的问问题是什么?出现了一个最大的问题是你的渠道丢了,你的门户没了。其实传统媒体的这个渠道是一直在丢失的,所以当我们要做新闻的时候,现在不可避免你要考虑渠道推广的问题。举个例子来讲,以这个为例,我们做内容怎么做呢?我是个文字稿件,阅读量上去,影响上去了,但是好处我都丢了。我这个项目跟新浪、跟网易都有很好的合作,我跟网易怎么合作呢?我把授权给他,放在他的网页上。但是我也跟他讲,放在你这里但是上面会有我的LOGO,在上面介绍的时候会有我的名字和域名。同时在底下的回连都会回连到财新网上,这是一个非常公平的合作。所以最后我们看了统计数据平均每个用户在这个上面花了半个小时,这半个小时的时间都是归网易的,他获得了这个注意力,获得了其他附带的好处,我们从这里我们获得了品牌的推广,同时在这底下回链回去的差不多20%。我们觉得这个是一个非常好的合作案例,对大家都有好处。

  有时候大家也会有人问我这么一个问题,你们做数据可视化,你们做数据新闻怎么挣钱呢?这个当然是我们要考虑的事情,你做这个事你要挣钱。我做数据新闻我是有把握的东西,第一,你不要做太大投入。那么在国外,做数据新闻谁做得最好?《纽约时报》,然后接下来是英国是《卫报》,还有布隆博格等等都做得非常棒,有那么几家,还有美国的NPR,纽约时报的水平是最高的,成本也是最高的。因为这么一个事情,你要做一个新事物,然后你还要做大投入,你还看不到回报,最大的可能就是过不了半年就被砍掉了,我们要考虑一个发展的问题,这是第一个,所以我们要控制成本。那么像我这个团队大概十个人,其实其中只有大概四个人专门干这件事情,其他的人还在兼顾干着其他事情。

  那么所以你可以认为说,我在这方面的投入主要是这四个人的工资,这四个人很优秀,里头我有的同事是又能写代码,又能做设计,包含有这样的人,这是控制成本。第二个的话,你要给企业回报。第一就是名,我们希望我们做的作品去评选评奖,一方面来讲如果得了奖,那么我们会有成就感、荣誉感,使得大家也会更努力。另外一个方面的话,你比如说我们在国内能拿第一,拿到国际上只能入围或者拿优秀奖,这样会给自己构成很大的压力和动力,逼你去进步。另外拿奖也是为企业在市场上做一个提升,也算是给企业一个回报。不白拿公司的钱。再有就是我们现在也帮一些其他的企业或者媒体等等,我们做一些可视化的外包,把我们的技术输出出去。在这个过程中,我们把自己看成是一个技术服务公司,我去做这件事情,也能给企业带来一定的回报,通过这样的事情,这样才能有可持续的发展。

  我们从去年年底到现在,我们做了很多的案例,这些案例的话,包括有支付宝的,有天猫的,有淘宝的,还有唯品会的,平安银行的等等,基本上来讲还有例如说之前的有一个市场调研公司,基本上来讲,或者是跨国公司或者上市公司,那么他们希望说用尝试更多的手段来展示他们的内容。像我们刚才为大家演示的产品,两天之内获得了二十万的访问量,作为一个市场回报来讲,这是非常划算的。

  这里是我们作品集的一个演示,我们所有手机类的作品都会放在这里。接下来的话,我会给大家分享一些我们在这以外做的其他一些工作。去年年底以来,我是跑了十多所高校,在许多高校做将多。主要以新闻传播学院为主,去介绍数据新闻的东西。我看到就是说,有一些高校现在已经非常的重视这个事情,那么他们是例如传媒大学、复旦大学等等,现在我都看到他们是在课堂上系统的教授这个数据新闻。那么我在做这件事情的过程中,我就会发现,我们太需要这种又懂新闻、又懂设计、又会写代码的复合型人才,但是我在国内一个都没有找到,在国外有,国内一个都没有,国内最好的情况是你能掌握其中的两门,而在国外的话,现在他们叫有意思名字叫哥伦比亚大学,他们都会开设的课是计算机和新闻的双学位,密苏里新闻学院也是,他们也会有意识的教授计算机。所以我认为这个是需要我们,业界和学界一起做这个事情,我也认为说现在在高校,新闻学院里头等等,就是你不培养复合型人才,你不培养将来要做记者的人,你不让他学写一些代码这是不够的。给大家介绍一下这三个网站,一个是我们自己的,这个叫数字说的网站,我们所有的数据都放在上面,叫财新数字说。第二个是叫财新数据可视化实验室,这个是实验室的网站,那么上面除了财新的作品以外,那么我们还放置我们分享一些体会、心得,那么上面也会有其他家的作品,以及我们平时搜集的很多案例分享还有一些活动信息等等,我们会放在实验室的网站上面。

  第三个是数据新闻网,数据新闻网主要是在境外读书的年轻人,他们很喜欢读新闻,他们用业余的时间搭建了这样一个网站,搜集了很多数据新闻方面的信息。

  最后的话,是我的联系方式。如果大家会后有什么问题的话,欢迎通过这个联系方式来跟我联系,这个维码只要你们一扫就把所有的联系方式存进去了,也欢迎大家加我微信,加微信的时候麻烦把你的实名和单位一块报出,这样方便我做记录,这个就是我今天要跟大家分享的内容。谢谢大家!

编辑:王天怡

关键词:大数据;研讨会

说两句

参与讨论

我想说

央广网官方微信

手机央广网

点击排行

违法和不良信息举报电话:010-56807188 新闻热线:4008000088 E-mail:4008000088@cnr.cn
网上传播视听节目许可证号 0102002 京ICP备05065762号-1 京公网安备110102000554
中央人民广播电台介绍 | 央广网介绍