返回上一页 文章阅读 登录

谷羽:语义网络分析方法在传播学中的应用及批判

更新时间:2020-07-06 16:48:15
作者: 谷羽  

   内容提要:语义网络分析方法是以计算机为辅助的呈现和解释词语关系的文本分析方法。从术的角度来说,语义网络分析方法全面实现了传播学研究探求文本的表意、修辞及社会动因的研究目的,但从道的角度来看,其作为“元认知”的计算设计与传播学理论结合的前景尚不明朗。传播学研究在应用这一技术工具时,应意识到语义网络分析存在理论无关、忽视语法结构的缺陷,从而在具体的应用场景中对语义网络分析方法进行修正和补充,重视开发语义网络分析方法对于传播学研究的定制工具。只有术道相长,才能进一步提升语义网络分析方法对于传播学研究的理论价值。

   关 键 词:语义网络/传播学/文本分析/研究范式

   作者简介:谷羽,南京大学新闻传播学院、南海研究协同创新中心在站博士后,湖北经济学院新闻与传播学院讲师。

  

   一、研究范式转向:语义网络分析方法引入传播学的时代背景

   在传统的传播学研究范式中普遍存在着寻求传播效果最大化的功能主义倾向。尤其美国学者主导的经验主义传播学派,主张像实验科学一样寻求传播现象的因果联系,就传者及其传播内容对受众认知产生的影响得出经验性的结论。随着后现代主义学者们掀起对于“社会学科寻求法则式命题”的批判风潮①,传播学研究的范式也遭到了拷问。黄旦发出了从功能主义向建构主义转化的呼吁,要求传播学研究“从社会决定论向社会互动论转化;从抽象的因果推论向具体的事实描述转化;从事例归纳向意义解释转化”②。传播学研究不再局限于对某种传播现象给予因果机制的判定,描述传播现象以及描述该现象发生的社会情境或所在群体特征也是传播学研究的重点所在③。从多元的、异质性的传播现象中发现新的研究主题,探索文本背后的意义如何建构、为何建构,成为传播学理论发展的新动力。

   研究范式改变的大背景下,研究方法的进阶显得迫切而必要。传统传播学研究中的实证主义方法常常使研究者有意无意地忽略研究假设之外的,更能体现事物多样性的小概率现象。而质化方法在运用理论解释现象或通过现象归纳理论的过程中,囿于落脚点(往往是个案)和研究者视角的个性化特征,难以展开横向比较。更为重要的是,随着大数据的兴起,传统的研究方法不适合分析碎片化的、大容量的传播内容,需要“引入一批如语义网络分析方法、语料库语言学等以计算机为辅助的研究方法”④。语义网络分析方法由此进入了传播学研究者的视野。

   语义网络分析最早见于认知心理学的文献,这一领域的学者认为词汇分层级、分类别地储存于人类记忆中,因而我们的大脑中存在结构化的意义系统⑤,呈现词语间关系的空间模型代表了深层思维表意的意图⑥。因此,可以依据词语的词频、共现频率以及间隔距离来探索文本中的意义。随着计算机信息处理技术的进步,语义网络分析方法作为机器学习(Machine Learning)领域的一个分支被广泛应用于人工智能技术,其在传播学研究中的应用刚刚起步。在已有的传播学研究个案中,语义网络分析被用于解读单个传播主体生产的主题聚焦的文本,或用于处理来自多个主体的零散信息片段,呈现出较强的适用性。例如,剖析总统讲话文稿,以理解总统的修辞方式和整套行政班子的政治观点倾向。⑦通过对开放式的问卷调查结果进行编码和归类,检验线下社交能力(外向,自信)更强的人在Facebook上是否更受欢迎。⑧

   从长远来看,由于语义网络分析方法较好地平衡了研究者的主观判断和文本语言逻辑的客观性,并且结合了社会关系网络分析和文本分析,语义网络分析方法将成为未来传播学研究的得力工具。

  

   二、语义网络分析方法在传播学领域的应用情况

   1.语义网络分析方法在传播学研究中的功能与应用场景

   语义网络分析的基本功能在现有传播学研究中均有涉及,包括高频词识别、词语共现及其权重模式、词语聚类和中心词呈现。它既可与传统的传播学研究方法结合起来使用,也可单独使用,具体应用场景可分为以下三类:

   一是基于语义网络分析的聚类功能,对传播学研究的主题进行分类梳理。例如对历年来参加国际传播学协会(ICA)会议的论文的主题进行梳理和呈现,可以发现传播学研究焦点的历史性演变;⑨或者,比较西方国家和东方国家的传播学研究主题的地域性差异与区域性特征⑩。

   二是用于数据挖掘的情感分析(sentiment analysis)。情感是人类传播的重要表达方式,侦测情感可以预测传播者的态度、行为倾向,因此被广泛应用于基于新闻文本的受众反馈研究、政治立场和意识形态研究等。语义网络分析方法通过有监督的注释可以完成对社交媒体文本的情感分类,其准确率接近人工编码的结果。(11)韩纲等人通过收集超过269万条癌症相关推文建构了关键词汇分类词库,在此基础上实现了同步呈现构成的语义网络(semantic network),以及对癌症的积极或消极情绪的情感网络(sentiment network)的可视化分析。(12)

   另外,语义网络分析方法可以与人工编码的情感分析相结合,呈现情感分布的细节和强度。例如,研究者搜集了一年内所有与疫苗接种有关的推特链接文章,人工将这些文章分为正面(支持疫苗接种)、负面(反对疫苗接种)以及中立(态度模糊或平衡)三个文本集。通过呈现三类情感文本集的语义网络,研究者发现正面态度文本的语义网络的聚合性强于负面态度文本:正面态度文本的语义网络围绕关键词“父母”建构,聚焦于传播接种疫苗的健康风险与好处,医学类名词显著度高;而负面态度文本的语义网络围绕着关键词“孩子”构建,聚焦于医院、媒体、疫苗产业等表示机构组织的词语。(13)

   三是用于传播学理论指导下的文本比较。传播学研究的文本分析主要有三个目的:一是追寻意义,二是描述结构与功能,三是发现文本的前因与后果。(14)在全球化和数字化的大背景下,跨文化、跨阶层、跨性别等另类文本的比较更适宜实现上述研究目的,呈现网络技术与传播图景的共变。语义网络分析方法以提炼文本的显著意义与逻辑关系实现了不同类别文本之间的横向比较。例如,黄冬通过比较政府网站与新浪微博围绕“中国梦”形成的语义网络,发现“中国梦”未在民众舆论场(新浪微博)得到预期的解读效果。(15)在这一研究中,语义网络分析帮助研究者直观地呈现了关于“中国梦”的政府文本与民众文本在高频词、词语联系上的差别,较好地说明了社交媒体并不遵从传统媒体议程设置的规律,并引导研究者进一步探求社交媒体的议程设置机制。

   语义网络分析不仅较为客观地呈现了文本生产者认知中的表意,还试图展现认知产生的逻辑推理过程,尤其适用于当下社交媒体中一对多、多对一以及多对多的传播情境。例如,语义网络分析可以通过处理来自多个生产者的文本集,探求群体的共同认知;或者通过处理特定生产者的多个文本,探求该文本生产者的认知结构,从而便捷地实现探求文本的表意、修辞方式以及社会动因的研究目的。

   2.语义网络分析方法在传播学研究中的适用范畴及局限性

   语义网络分析也有其应用边界。需要认识到,所谓的“语义逻辑”并不是本质的事实,很大程度上是研究者和作为研究对象的文本生产者共同建构的产物。

   基于经验的文本研究是为了反映文本在不同情况下的类型化表现,而不是穷尽所有文本的所有表现形式。语义网络分析可以将文本中的语义关系精炼化与类属化,但不适宜作为描述性的调查方式而被独立地应用于传播学研究中,它需要与其他研究方法结合,在描述的基础上对传播机制加以理论化地诠释。具体而言,研究者需要注意两个陷阱:

   首先,由于语义网络分析不能实现与文本生产者的直接对话,所以语义网络分析并不能就文本差异对复杂社会背景下文本生产的机制进行解释。以情感分析为例,语义网络分析虽然可以区分正面情感和负面情感,但是它无法探知正面情感或负面情感产生的社会机理。因此,语义网络分析一旦脱离传播学研究的人文关怀,就会变成纯粹的文字游戏,缺乏理论进步的动力。从信度方面来说,由于受到获取网络文本的时间节点以及网络文本等“自由”文本(free text)的匿名发布行为的限制,难以确信文本的情感表达真实反映了主体的意图,因此在用语义网络的文本分析结果预测文本生产者的现实行为时需要格外谨慎。

   其次,语义网络分析只对词语共现关系作出判断,不考虑文本的语法结构,在数据清洗的过程中要去除冠词、介词、连接词等不产生实际意义的词语。其遵循的是乔姆斯基的形式语言学判定,即“句法具有自主性,独立于语义之外”(16)。因此,语义网络分析更适用于处理数据容量大、碎片化程度高、语法结构不严谨的用户生成文本(User Generated Content),如社交媒体用户的发布内容。对于新闻报道等复杂文本,语义网络无法实现类似《作为话语的新闻》等经典传播学研究的文本解读,即通过解剖关键句子的语法结构发掘文本中暗藏的权力隐喻。这或许造成了语义网络分析最大的缺憾:尽管语义网络分析的平面化呈现强调了意义关联(association),但将语法(syntax)的意义排除在分析之外无助于挖掘文本的意义层次,及其与社会结构之间的互动。

  

   三、对术的考量:语义网络分析方法的技术渊源及反思

   鉴于语义网络分析方法主要依赖计算机技术实现对文本(或语料)的词语提取、词语关系分析和可视化呈现,很多传播学者仅仅把它看作是传统文本分析方法的技术更迭。不可否认,当代人文科学的发展在很大程度上依靠技术,但技术不仅是一种工具力量,也是一种文化力量。从术的意义上理解语义网络分析方法,除了关注其作为技术手段本身的器具特征,也要关注它对于人文和社会学科,尤其是传播学,所带来的文化影响。因此,本文需要从技术哲学的视角讨论语义网络分析方法的理论起点、方法论问题和形而上学问题。

   1.以认知逻辑为中心的理论起点

   典型的语义网络结构呈现为一个树枝型联系图(见图1),反映认知逻辑的拓扑关系。以图1为例,“微博”“个人”“信息”构成了该语义网络中的三大中心节点,说明它们是新浪微博用户表述隐私时最频繁提及的词语。放大其中的一个细节可发现:“保护”和“侵犯”两词鲜有直接的词语联系,说明新浪微博用户在探讨隐私问题时较少同时提及保护和侵犯,尽管两者被提及的频率相同。研究者据此可进一步推断,新浪微博用户对于隐私权的实践存在较大争议。(17)

   由图1的案例可知,在语义网络图中,任意两个词语间的联系代表着一个命题。而命题反映的是文本生产者头脑中事物的联系,以及他试图向读者呈现的事实。命题告诉我们一种事态,在本质上它必定与事态有关联,即“命题是事态的逻辑图像”(18)。如果同样的词语发生联系的方式不一样,那么它就建立了一个新的命题,表达了关于某个事实的新的意义。从本质上说,语义网络是一个受文本生产者认知制约的逻辑图谱。

因此,每一个文本(集)都是文本生产者做的一次命题试验:通过变换词语组合的逻辑来建构关于某个事实的意义。由于语境的丰富和随机切换,词语组合逻辑的多样性是客观存在的。新闻文本的语义网络呈现的是记者/编辑头脑中的事实逻辑,虽基于客观事实,却有着再造事实的无限可能。在符号本体论的理论预设下,研究者用语义网络分析方法还原文本生产者的意图,是对人类认知世界的视角进行再认识的“元认知”。“元认知”具有顶层设计的哲学意义,在语义网络分析方法中体现为针对词语连结展开的精确运算。(点击此处阅读下一页)

本文责编:陈冬冬
发信站:爱思想(http://m.aisixiang.com)
本文链接:http://m.aisixiang.com/data/121986.html
文章来源:《现代传播(中国传媒大学学报)》2019年第4期
收藏