央广网

教育频道 > 教育频道专题 > 首届大数据时代创新与媒介变革研讨会 > 要闻

央广网

周庆山:信息管理领域研究方法的大数据应用

2015-03-27 15:04:00 来源:央广网

   

  央广网北京327日消息 327日,由中央人民广播电台新媒体宣传中心、河北大学新闻传播学院、中国社会科学院世界传媒研究中心、中国科技新闻学会网络媒体专业委员会共同主办的“首届大数据时代创新与媒体变革研讨会”在京举行,本次研讨会以“时代创新 媒介变革”为主题,围绕大数据时代全球网络文化发展趋势,探讨全球媒介创新发展未来。网络文化建设和管理部门、科研院校、国家核心学术期刊负责人、专家、学者共200人出席会议。

  北京大学信息管理系教授周庆山发表题目为《作为信息管理领域研究方法的大数据应用初探》的主旨报告。大数据到底在哪里?周庆山表示,大数据是一个虚无缥缈的东西,只听说没见过。其实,大数据的应用较多在公共治理方面,比如用大数据整治交通的问题、公共卫生的问题、订票系统等。大数据可以作为科学研究,比如说生物信息、生物医学、地震预报、天气预报等。甚至可以通过大数据上的搜索,可以分析流感的发病和增长趋势。

  以下为文字实录:

  非常感谢我们这个伍刚主任邀请,我今天来真的是学习来了。在座的各位都是我们媒体界还有学术界对这个题有很深的研究。我来了一看是一个很大的论坛,我其实我本人工作的单位并不是媒体界,我们这个单位就是李彦宏毕业的单位,百度李彦宏原来是读书情报系现在是信息管理系。这个李彦宏我还想说一下,实际上我们说,原来我们学科的学生毕业比较多去的单位是IT界,情报界这个领域。但是现在随着社会发展、信息化的发展,确实出现了一个新的趋势,就是信息技术和媒体的一个融合,包括电信的融合带来新型的社会形态,这个形态就使我们这个信息管理和我们媒体传播有机的结合。比如说百度可以说是一个IT行业、互联网行业。但是像百度、新浪、网易他们现在越来越具有一定的媒体性。今天上午听了几位专题讨论讲了一个问题,其实现在对大数据都会问一个问题,大数据到底在哪里?我也在想这个问题,大数据是不是离我们很远,我们现在讨论的是一个虚无缥渺的东西。我记得去年在微信上看了一个很有意思的笑话,说北京老是不下雪,偶尔有的地方见着下了一点就像大数据一样,只是听说过没见过。这个大数据实际上我自己这样想,它其实跟我们这个媒体关系还是非常密切的。它的密切一个非常重要的方面,我觉得就是大数据现在就来源于什么呢?媒介融合下的受众。以前我们在传播学里面,我们关注和研究的受众问题,但我们说今天的这个受众是哪些人呢?今天的受众我觉得最代表性的就是我们现在的网民,比如说有一个调查,现在中国的网民是6.75亿,手机网民是5.57亿。

  我这正好又看了一下伍老师编的那本书上有一个口径,我觉得数据非常好。我在这里抄录了几个,全球的网民是24亿,亚洲是11亿,全球有11亿的智能手机。这些东西意味着什么呢?就是过去的传播对象是读者、是听众、是广播的听众、是观众。今天受众是什么呢?就是这上亿,几十亿的网民。这些网民像过去通俗的讲叫产销合一环境下内容生成环境下他们就是大数据,这个大数据也就是我们要关注的一个很重要的内容。

  我这里头列举大家都比较了解的,我想我今天要讲的这个问题就涉及到一个我既然在学校里,我们实际上研究传播学,研究数字媒体,研究社交媒体,研究信息问题,那么我们在学校里的研究也好,包括教学也好它也面临大数据的挑战,什么挑战呢?就是大数据条件下的研究方法的挑战,所以我今天想讲的问题主要从研究的角度。我们这里头对大数据的研究,首先我们做了一些搜集,大数据虽然我们好像平时不怎么看得到。但是我们的研究说明了它这个事实的存在,就是人们关注的焦点。我们这里统计了从2010年到2014年,这些年研究的论文有3598篇,而且大家可以看出来它有了一个爆炸性的增长在2013年到2014年,增长的速度非常的高。这就说明什么呢?大数据它不仅是业界关注的话题,而且是很多行业关注的话题,同时它也成为我们科学研究像我们大学的老师关注的一个话题。

  那么我们说大数据现在有一个观点,科学的研究也进入了一个叫数据科学时代,那么这个研究被称做叫什么呢?按照格雷的观点叫实验科学、理论科学、计算模拟之后第四范式叫数据密集型心科研这样一个新时代。这个大数据的应用比较多讨论的是公共治理,比如现在用大数据整治交通的问题、公共卫生的问题,你比如说百度的李彦宏就说了,我们将来必须要改变今天我们挂号人山人海,我们要解决怎么能够让他们不用去挂号,凌晨就去挂号,很多号贩子,你看现在很多火车票就解决了一部分,订票系统解决了一些。还有一些商业营销的应用。还有一个就是我这里想说的,它实际上也是一个方法论,大数据它可以作为科学研究,而且这种研究已经应用到了很多领域,比如说生物信息、生物医学、地震预报、天气预报。那么特别是有一些很有意思的研究应用,你比如说谷歌用它海量的数据开发了一个叫"谷歌流感趋势"的工具,通过这个大数据上的搜索,可以去分析流感的发病和它的增长趋势。另外一个,甚至以前中科院有个博士生他研究一个问题,就是根据搜索的数量来研究股票的市值的增长和它的演化。

  那么这个大数据有很多的模式,其实它从某种意义上来讲是计算机技术还有就是数据的科学技术在后面的应用。那么这种应用,我们说它对于科学研究来讲就是变成了一种新的挑战,过去我们在科研当中我们要研究一个对象的时候,特别时政研究我们都要做一个抽样调查。按照这两位学者在大数据里说到的,就是大数据时代的抽样和我们过去的抽样是不一样的。我们现在不会,也就是我们现在讲的,不是像以前讲的小样本的东西,而是用全样本。传媒进化,实际上我觉得大数据还不能光说数据这两个词,数据容易给人感觉是数学,或者是数字。实际上我觉得这里面的大数据有一个很重要的东西是什么呢?就是数字内容,大量的数字内容。而这种数字内容我们现在需要对它进行一个原数据的标引,建立起一套系统,在这些原数据标引过程中我们就从这些数据里头找到一些,发现一些我们过去不容易找到的一些规律。这种规律甚至在国外也做了一些实验,通过这种来分析一些人过去很难分析的行为,通过传感器把他每天每时每刻搜集起来,有的时候可以分析人的疾病,他的趋势。比如每个人身体上有各种传感可以随时把数据收集起来然后定向的跟踪。就像以前我们说高血压我们测量24小时,以后可以随时动态的测量,然后把大量的数据汇总起来。甚至可以描绘一个人把这个人变成一个虚拟人然后来构建起来。

  那么对于传播来讲它也有一个很重要的应用在于,我们分析传播源,传播的文本,比如说现在的情感分析,就是内容特别网民发表的内容。还有像微博上的舆情分析也是应用了一些大数据的理论。然后方法,另外媒介属性的分析,不同媒介它的特点、它的生态规律、它的演化规律,特别是现在社交媒体的应用。然后现在用各种各样的方式,来对各种各样的媒体然后进行一定的数据收集、汇总,来分析比较这些数据它的用户流量是多少,这些数据的传播能量有多少,它传播了哪些数据量。另外一个就是我前面讲到的,生成的数据里有一个很重要的方面,大量的数据。但是,我觉得这部分其实以前有个理论叫数字商品论,现在可以叫数据商品论,那么还有就是它的效果的问题。在这个部分里头,有很多的成果涌出来,这些年也有很多传播学研究、媒体研究和信息研究都在讨论一些用大数据去分析的一些成果。比如说比较多的用在社交媒体的研究,特别在国外这是一个新兴的很热的学科。另外上午有人讲数据新闻的研究,特别是强调社会网络的影响。包括,社会网络的分析,另外就是互联网的舆情分析,用户、网络用户的消费模式的分析。

  那么都已经产生了很多成果。比如说(奥康尼)他就研究说通过挖掘推特得到的用户反应,与传统的调查投票的方法的结果具有高度的一致性,证明了用这种数据挖掘的方式它和传统的研究方法是有它的一个先进的地方。另外一个就是它可以去分析一些媒体的刚才我讲的这都是通过把数据支撑下然后形成可视化来帮助我们去更好的了解媒体的规律,这个里面介绍了媒体有些什么特点呢?比如说社交媒体,英国和美国的社交媒体它的用户有什么特点,比如说他的用户喜欢信息的编纂和交流,而不是分享。印尼和中国处在增长阶段,用户喜欢关注内容小组活动,有不同的规律和特点。比如最近就有很多人在关注柴静的《穹顶之下》,这个《穹顶之下》它为什么产生了那么大的影响?为什么人们会讨论它?这里边的传播规律和动力机制是什么?那么这些方面的关注也成为我们说的对通过对后边数据的分析然后来去了解柴静的《穹顶之下》出来之后网站的报道量都有哪些的网站,网民在讨论的时候在微博里头我们说微博里的信息就是一个大数据信息。他们都看了些什么内容,里面关注的焦点是什么?情感偏什么呢?它是负能量还是中性,还是正能量,现在我们都强调一个正能量,大数据的应用,所以我们说它对于我们说的信息与传媒的研究带来了一个非常大的变革,这是一个值得我们科研工作者关注的一个课题。我们需要关注,我们以往的研究方法怎么能够借助大数据。这里面就需要去,我这里面比较了一下传统的传播学研究有这样一些方法、问卷、内容分析的、深度访谈的,有些属于秩序研究,像扎根理论、焦点小组等等,这里列的不够全。

  比如说以前我们在讨论研究方法的时候经常谈三大纬度,一个叫客观的时政研究,另外一个主观的秩序研究,另外还有一个被称作追求一种第三条道路的现象学研究,但是我们今天思考的大数据它到底是一种倾向这种主观解释的还是客观时政的呢?它偏于哪一个呢?是不是真的就是一种新的现象学研究这些都是很值得我们去关注的,当然了大数据的研究同样存在一个问题。就是今天上午有很多人讨论到一个问题,大数据的特点就是混杂的,结构的非结构的,多类型的,量非常的大,而且这些数据它和我们今天的抽样的精准性相比是有很大的不足的。我们现在当然还有一个待会儿匡老师会讲到的,就是隐私的问题,其实大数据对于我们来讲其实世界很多国家都开始考虑围绕它来修订我们今天的一些政策规则,这些规则要从大数据的角度去关注,比如我这里也提到一些比如说上午很多人也提到了,就是现在国际上在关注一个什么话题呢?叫"数据的开放问题"政府的数据能不能开放出来,共享。科研机构的数据能不能开放出来,这些商业网站的数据你能不能有一种方式把它开放出来,开放出来为我们社会进行利用、进行加工、然后进一步的进行服务。因为现在的这个数据被特定的平台包括像马云的平台、很多平台被它垄断。有一些被移动垄断,垄断之后自己也想说这是我的资源,他也知道这个东西不能随便给别人,我要给了别人,那我的专有性就没有了。但是,这些资源今后应该如何去开放?它的专有性、垄断性,另外这些数据里必不可少的一个话题就是安全问题,信息的安全,还有商业的秘密,还有个人隐私的问题,这些都是值得我们去关注的一些话题。好,谢谢大家!

编辑:王天怡

关键词:大数据;研讨会

说两句

参与讨论

我想说

央广网官方微信

手机央广网

点击排行

违法和不良信息举报电话:010-56807188 新闻热线:4008000088 E-mail:4008000088@cnr.cn
网上传播视听节目许可证号 0102002 京ICP备05065762号-1 京公网安备110102000554
中央人民广播电台介绍 | 央广网介绍