社会热点
百度指数的自然数据应用于议程设置理论的实证研究
2022-12-26 23:07  浏览:209

本研究将百度指数这样的自然数据应用于国内的议程设置理论的实证研究,其研究的问题是,中国国内的媒体议程的显要性和受众议程的显要性关系如何?其关系受到何种条件的制约?

一、引言

议程设置理论是大众传播学的重要理论之一,因为它使得大众传播学研究从态度层面转向认知层面,并且提供了大量实证研究的证据。在议程设置理论研究中,研究者常常使用调查或者实验方法来对受众议程进行研究,但是调查或者实验方法得到的自我报告的信度有时候难以得到保证。例如,问卷调查作为一种反应类研究,即被研究者知道他们在被研究的这项事实,而这就容易产生如“语境”、“结构–能动性干扰”等对问卷调查质量的影响。

随着自然数据的出现,各种预测行为,如总统竞选预测或总统候选人预测都可以使用其来进行分析。所谓自然数据指的是,数据并不通过问卷获得,而是在现实生活中自动形成,其特点是价值型、多源性和碎片性。自然数据属于非反映与无干扰的测量方法(),也就是说,测量工具不会对研究者造成干扰或侵犯,其关键特性是被研究的人不知道有人在研究他们,而是“自然地”留下他们社会行为或行动的证据。

国外将自然数据应用于议程设置理论实证研究数年前已经开始了,如等通过使用自然数据分析2012年的社交媒体上的29个政治问题。Vargo等则通过对2012年美国总统推特上的自然数据进行分析来探索议程设置假说理论。等基于议程间的设置理论,通过对2012年总统选举中推特内容进行的自然数据分析。Guo和Vargo通过自然数据分析和语意网络分析,研究了2012年美国总统选举中收集的推特数据。国外的研究显示了自然数据应用于议程设置理论实证研究的生命力。国内自然数据则多应用于舆论的研究,如喻国明对2012年中国人使用百度搜索引擎进行搜索的信息热词和新闻类热词进行分析和挖掘。喻国明对百度搜索词数据进行数据价值挖掘,构建了反映社会舆情基本面状况的百度舆情指数。喻国明通过对自然数据的分析,找到2011–2013年全国两会舆情热词中的中心词和关联词。其他的研究者在利用自然数据来研究舆论也做出了一些贡献。当然,也有一些研究是利用百度的相关功能进行议程设置研究,如李贞芳等《网络媒体的舆论功能研究》,以“过去30天内百度新闻搜索中与该网络媒体最相关的新闻数量”来测量媒体议程显要性,以“网民在百度的搜索量”来测量受众议程显要性,尽管当时可能还没有百度指数,但是这篇文章基本测量指标与百度指数达到了非常类似的效果。不过,该文得出的结论如网络舆论还不足以构成主流舆论,随着互联网的发展和我国上网率的增加,则需要重新来分析。

议程设置理论是大众传播学最重要的理论之一,本研究将百度指数这样一种自然数据方法应用于国内的议程设置理论的研究。本研究的问题是:中国国内的媒体议程显要性和受众议程显要性的关系如何?其关系受到何种条件的制约?

二、议程设置理论及实证研究

1968年美国总统大选期间,和Shaw在北卡罗来纳州的查佩尔希尔地区通过实证方法得出结论:“大众媒介对不同竞选议题的强调程度,不仅在很大程度上反映了竞选者对重要议题的强调程度,而且也与选民对各种竞选议题重要性的判断之间,存在极高的相关性”,也就是说大众媒介创造了选民头脑中关于外在世界的图像。等人在后续研究中,多次强调议程设置的核心概念是显要性的转移,由媒体议程的显要性转移到公众议程的显要性。议程设置关心的核心问题是媒体议题与公众议题间的关系。等人反复重申,“议题设置”的核心是“在很大程度上,媒体认为的重要事件可以成为公众的重要事件”。“议题设置”是通过传递显要性(由媒介到受众),而不是通过决定对于某个特定事件的正反面的观点而发挥作用的。

整体来看,国内外在研究议程理论在中国的适用上,通过自然数据来进行议程设置理论实证研究的论文并不很多,另外,国内议程设置理论研究中分析其关系受到何种条件的制约中,主要分析的条件是不同媒体、不同受众对国内媒体议程显要性和受众议程显要性关系的影响,而对不同类型事件对国内媒体议程显要性和受众议程显要性关系的影响缺乏系统全面研究。当前这方面的研究仅局限于个案的分析,如陶贤都等通过对杨丽娟事件报道的内容分析,发现以报纸为代表的传统媒体和以网站为代表的网络媒体间存在着一定程度的议程互动。周敏通过分析《新闻1+1》对钓鱼岛事件的报道来研究媒介与受众共建议程设置。而现实中,在某些事件上,中国媒体的报道是受到限制的,而这自然会影响到其议程设置的能力,即媒体议程显要性对受众议程显要性的影响减弱。而国外媒体在大部分的话题报道上,却较少受到限制,这也导致了国外学者较少关注这一方面的研究。所以,对不同类型事件对国内媒体议程显要性和受众议程显要性关系的全面、系统的研究,并探索其中是否与媒体的限制性有关就成为了相关研究的空白,本研究目的是对相关事件进行分类,并通过自然数据的进行分析,来填补这样的空白。

三、研究方法

搜索引擎的搜索查询是使用自然数据的一个很好的工具,本研究采用目前在中国排名第一的搜索引擎——百度指数(也可称百度搜索指数)作为自然数据的分析工具。本研究的目的是通过自然数据分析媒体议程显要性与受众议程显要性之间的关系,在受众议程显要性上,通过百度指数来检索网民关注议题的热度。选择什么样的议题来检索就成为研究的关键,为此,本研究采用十八大以来,2013-2016年的75个网络热点舆情事件作为检索议题,挖掘网民对此的关注热度,作为测量受众议程显要性这一变量的方法。

2012年11月,党的十八大以来2013年医学热点话题,我国的网络舆论发生了很大的改变,从2013年到2016年,人民网的舆情监测中心继续每年发布《中国互联网舆情分析报告》,并且每年都刊登网络热点舆情事件列表,总计共75个,就成为本研究的议题的样本框。之所以采用网络热点舆情事情,是因为这些事件引起的社会影响和研究价值都非常之大,目前已经有了很多相关研究,但相关研究很少谈到媒体报道在其中的作用,仅有的如李良荣等发现网络首发,有央媒参与报道、醒目头条是这些事件发生的关键因素。可能有研究者会质问网络热点舆情事件会不会本身就是媒体报道或者网民讨论的热点事件,缺乏研究的价值,并且是否会忽略其他的非网络热点舆情事件。事实上,本研究主要分析媒体报道中报纸的报道量与网民在百度的搜索量之间的关系,一般来说,不同的网络热点舆情事件虽然都较热,但是报纸的报道量与网民在百度的搜索量是不同的,因而可以进行相关分析。更为重要的是,在人民网舆情监测中心提供的75个网络热点舆情事件清单中,有些并不是很热,如乌克兰政局剧变,其媒体报道中报纸的报道量与网民在百度的搜索量并不高(稍后的数据会显示),所以这些少数事件正好类似于非网络热点舆情事件,因而就有了对比分析的价值,并使得研究具有一定的推论性。

在具体检索中,本研究采用的百度搜索指数是以网民在百度的搜索量为数据基础,以关键词为统计对象,科学分析并计算出各个关键词在百度网页搜索中搜索频次的加权。具体通过检索75个网络热点舆情事件的核心关键词来获取数据。

接下来,本研究将分析媒介对2013-2016年75个网络热点舆情事件的报道量,并将其作为媒体议程显要性的测量指标。这里,本研究把媒体报道数量操作成为中国重要报纸全文数据库对该事件发生当年的报道数。由于百度指数查询的规则与中国重要报纸全文数据库的查询规则有些差异,因此查询关键词略有调整,由此得到媒体议程的显要性。通过人工通读这些报道,发现关键词所检索出来的都为相关热点事件的报道。

综合2013年到2016年75个网络热点舆情事件的百度指数检索和中国重要报纸全文报道数据,得出表1。

2013年时事政治热点汇总_2013年医学热点话题_2013时政热点 2013年时事政治汇总

四、研究发现

本研究对75个网络热点舆情事件的百度指数的最高的周平均值和中国重要报纸全文数据库的报道量进行相关分析,发现这两者相关的系数为0.13,但并未通过统计学的显著性检验,即不相关。但是不同的网络热点舆情事件,媒体的报道关注显然不同,当根据不同的网络热点舆情事件进行分类的时候,是否其百度指数的最高的周平均值和中国重要报纸全文数据库的报道量会相关呢?为此本研究参照以往的研究,对网络热点舆情事件进行分类,根据网络事件的属性分为政治事件、自然事件、文化娱乐事件、社会新闻事件这四类。发现社会新闻事件45个、政治事件22个、文化娱乐事件5个、自然灾害事件3个。

在45个社会新闻类网络热点舆情事件百度指数最高周平均值和中国重要报纸全文数据库的报道量进行相关分析中,发现这两者相关的系数为0.301,且通过统计学的显著性检验(双尾检验,显著度

而22个涉及政治的,5个涉及文化娱乐的,3个涉及自然灾难的网络热点舆情事件的百度指数最高周平均值和中国重要报纸全文数据库报道量的相关系数都未能通过显著性的统计学检验,即不相关。

为什么在45个社会新闻类网络热点舆情事件中,代表媒体议程的中国重要报纸全文数据库的报道量和代表受众议程的百度指数的最高周平均值会呈现出低度的显著相关呢?比较这45个舆情事件,发现有些事件报纸报道和网民关注搜索是同步的,如马航航班失联;有些是报纸报道量很高,但网民关注搜索量并不高,如屠呦呦获2015年诺贝尔医学奖;有些则是报纸报道量不高2013年医学热点话题,但网民关注搜索量却很高,如哈尔滨大火事件等。正是由于这些事件的报纸报道和网民关注搜索的不均衡,导致它们低度相关。

除了社会新闻事件,其他事件如果细分是否会出现新的结果呢?本文对政治事件进行二级分类,分为国内宣传政治事件9个,包括高层政治事件(3个,即薄熙来案、中央对周永康立案审查、令计划落马)和政策政治事件(6个,即“光盘行动”、纪念中国人民抗日战争暨世界反法西斯战争胜利70周年大阅兵、北京张家口成功申办冬奥会、李克强敦促各部委简政放权、国家主席习近平对美进行国事访问、杭州G20峰会);国外政治事件(6个,即斯诺登“棱镜门”事件、乌克兰政局剧变、欧洲难民危机引发国际关注、南海仲裁事件、2016年美国大选、朴槿惠“闺蜜门”),国内其他政治事件7个,包括群体事件政治事件(5个,即香港“占领中环”事件、台学生占领“立法院”事件、广东茂名PX项目群体事件、帝吧表情包大战、“连云港反核”)和言论政治事件(2个,即《南方周末》事件、甘肃初中生发帖被刑拘事件)。

对这些事件最高周平均值和中国重要报纸全文数据库的报道量进行相关分析,结果显示,6个国外政治事件的百度指数的最高周平均值和中国重要报纸全文数据库对其的报道量的相关性是0.869,相关性很高,且通过了显著性的统计学检验(双尾检验,显著度

进一步分析9个国内宣传政治事件可发现,在3个高层政治事件中,中国重要报纸全文数据库报道数并不多,但是最高百度指数(周平均值)却非常之高,即网民非常关注此事,并且“中央对周永康立案审查”还成为2014年网络热点舆情事件中百度指数(周平均值)最高的。而在6个国内政策宣传政治事件中,有些事件尽管中国重要报纸全文数据库报道数非常之多,如李克强敦促各部委简政放权(1133篇)、杭州G20峰会(1561篇),但是网民们并不太关注这些事件,其相应的百度指数(周平均值)并不高。

五、研究发现

1.社会新闻事件或国外政治事件中时“两个舆论场”为显著相关

在中国的语境里,媒体议程的显要性近似于新闻媒体着力营造的舆论场,也被称为官方舆论场;受众议程的显要性近似于老百姓的“口头舆论场”,这里将其称为民间舆论场,相关研究者指出这两个舆论场并不总是一致的。本研究通过对2013年到2016年的75个网络热点舆情事件的自然数据分析,发现在网络热点舆情事件属于社会新闻事件或国外政治事件时,两个舆论场是显著正向相关的,特别是国外政治事件中,更是显著正向高度相关。

本研究显示,中国的媒体议程显要性和受众议程显要性的相关性受到网络热点舆情事件属性这一条件的限制,当网络热点舆情事件属于社会新闻事件或国外政治事件时,相关性就得到验证。之所以国外政治事件媒体议程和受众议程能够高度相关,在于这些事件都不属于与受众切身相关的抽象议题()。在以往的国外研究中,如对加拿大三个公众议题显要性的研究,在16个月的时间里,新闻对通货膨胀的报道模式与这个议题在加拿大公众中的显要性意见缺乏一致性(0.28)。但是,在国家凝聚力这个抽象议题上()却存在高度一致性(0.96)。而本研究也显示,在国外政治报道的这一抽象议题上(),中国的媒体议程和受众议程的相关性也达到高度一致(0.869)。而且,要补充说明的是,本研究者两变量是定距变量的相关,比一般议程设置排序的定序变量相关的级别还要高。

在社会新闻类网络热点舆情事件中,媒体议程的显要性与受众议程的显要性仅是低度显著相关。其中可能的原因是个人经验产生影响,当受众在接触国外政治报道的时候,由于几乎没有直接的个人经验,因此就容易受到媒体议程的影响。而在社会新闻事件中,由于有直接的个人经验,因此,虽然也受到媒体议程的影响,但是其相关性就没有这么高。不过,由于本研究的数据限制,尚不能确定是媒体议程的显要性影响受众议程的显要性,还是受众议程的显要性影响媒体议程的显要性,或是两者的互动而成。这需要未来的研究再深入地挖掘和探讨。

2.其他事件的“两个舆论场”相背离及解决办法

本研究还发现,一方面,在国内宣传的高层政治事件中,中国重要报纸全文数据库对该事件发生当年的报道数并不多,但是最高百度指数(周平均值)却非常之高,即网民非常关注此事。也就是说,这些事件也存在着一定程度的“两个舆论场”相背离的情况。另一方面,在国内宣传的政策政治事件中,有些事件尽管报道数非常高,但是网民们并不太关注这些事件,也就是说,这些事件中也存在着“两个舆论场”相隔离的现象。

之所以在一些网络热点事件中出现两个舆论场相隔离,其主要的问题恐怕是政府想要宣传的事件,如北京张家口成功申办冬奥会并没有很好满足受众的需求。而受众关心的事件,如高层政治事件、群体性事件、言论政治事件,即使在民间舆论场讨论得沸沸扬扬,但是由于相关宣传报道的限制,我国主流媒体难以对这些事件进行全面、充分的报道,所以导致媒体议程难以很好地影响受众议程。但是一个问题就随之而产生了,如果主流媒体不能在这些问题上勇于发声,那么将难以真正地影响受众的议程、观点和态度。在解决不同的舆论场相隔的建议中,童兵就指出,如果官方或主流媒体能够自觉地抢报敏感话题,敢于设置重要议程,在第一时间报道突发公共事件,公信力肯定会有所提高。因此,官方或主流媒体在重大社会事件和重大社会问题的报道及评论上要争夺话语权,同普通群众想在一起、说在一起,同时还要及时回应民间舆论场的热点和焦点话题。

六、结语

1.本研究理论和方法上的贡献

在理论上,本研究贡献点在于对网络事件进行分门别类的类型化研究,深化了议程设置理论中的不同议题研究。本研究发现,由于在某些新闻事件上,可能是中国的媒体受到了这样或者那样的限制,导致媒体的议程难以很好影响到受众的议程,这深化了人们对议程设置理论在中国的实证研究的认识。

在方法上,本研究将百度指数数据作为一种“自然数据”应用于受众议程显要性,对于理解网络数据应用于议程设置理论研究是有价值的。

2.本研究的局限与未来的研究方向

由于数据限制,本研究仅将百度指数作了受众议程显要性的测量,而受众议程显要性的测量方法有很多,如将网络论坛讨论的热点话题作为受众的议程的显要性。为此,未来的研究也需要测量通过不同方法得出的受众议程显要性究竟与媒体议程显要性的关系如何。其次,虽然百度指数作为一种方便使用的自然数据方法,相关研究都常用其来研究舆论,但它的代表性和准确性还不能完全确定,因为百度指数只能看到结果,而没能看到数据产生的过程,因而属于黑箱子。再次,本研究仅仅分析媒体报道与公众关注度之间的相关性,并没有充分关照媒体之外其他因素,特别是社交媒体的影响,考虑到今天议程设置机制正在发生变化。因此未来的研究在分析受众议程的时候,不仅要分析公众对某一话题的关注度,还要分析社交媒体的热议度。

此外,在媒体议程的显要性测量中,本研究仅将中国重要报纸全文数据库对该事件发生当年的报道数作为媒体议程的显要性。在未来的研究中,应该将报纸扩展到广播、电视等多种媒体,甚至包括网络媒体,尤其是社交媒体,才能更好地分析不同类型的媒体议程的显要性与受众议程的显要性的关系。在测量显要性方面不仅测量报道数,还测量报道的长度,报道出现的版面位置、时间段,这些都是分析媒体议程的更多指标。其次,在分析网络热点舆情事件后,还需要分析更多的网络事件,分析不同热度的网络事件中的媒体议程和受众议程之间的关系,才能更好地找到不同议程之间的关系。另外,在分析网络事件中的媒体议程和受众议程的关系中,不仅分析相关关系,还可以根据时间先后来分析相关,最终发现哪个议程影响哪个议程,从中找出媒体议程和受众议程之间的因果关系。

还应该看到的是,百度搜索指数仅是一个公开、权威,但也是简单的自然数据分析工具。自然数据的应用还有更为复杂的方法,如机器学习,情绪分析软件等,未来的研究在确保效度和信度的基础上可应用更多的工具来研究。另一方面,自然数据应用并没有颠覆现有的社会科学的研究范式,自然数据并不是一个万能药或者能够替代传统社会科学研究中的各种方法。传播学上百年形成的抽样调查、内容分析、深度访谈仍然在自然数据应用中有其独特的作用与意义。因此,自然数据应用需与这些研究方法结合起来,才能具有更高的信度与效度。

(曾凡斌:《百度指数对议程设置理论的检验及“两个舆论场”的关系——基于2013-2016年75个网络热点舆情事件的分析》,阅读原文及学术引用,请务必参考《新闻记者》2018年第11期)

2013年医学热点话题_2013年时事政治热点汇总_2013时政热点 2013年时事政治汇总

在这里,读懂转型中的中国新闻业

在这里,探讨新闻业的未来

在这里,进行深入而严肃的思考

在这里,关心新闻人自己的命运!

帮助

发表评论
0评