返回上一页 文章阅读 登录

张耀铭:数字人文的价值与悖论

更新时间:2019-10-18 20:55:43
作者: 张耀铭 (进入专栏)  
2016年开始,由密歇根大学数字人文项目发起的年度数字人文研讨会(简称GDHS)已举办三届。1977年8月,第三届人文领域计算机国际会议由加拿大蒙特利尔大学和滑铁卢大学共同主办,参加会议的有人文、计算机、数学、工程等领域的专家,跨学科交流了词典学、历史、音乐、舞蹈、文学数据管理与计算机辅助教学等领域的新研究发现,并出版了论文集。从此以后,编辑出版会议论文集,成为扩大数字人文会议影响的重要形式。有学者分析了近50年国际数字人文研究的高被引文献,在排名前十(被引频次≥10)的知识来源中,图书类文献8部,学术论文2篇,表明图书对推动数字人文知识结累和研究演化的贡献力度更大。明尼苏达大学出版社2012年出版的《数字人文学科的争论》排名第一。这本会议论文集,收录美国数字人文教育机构、高校以及图书馆领域的数十位专家发表的论文,“旨在探索数字人文理论、方法和实践,试图挖掘出数字人文的发展潜力与张力”。麻省理工学院出版社2012年出版的《数字人文研究》,排名第二。该报告不仅回答了“数字人文是什么?”这一核心问题,而且提供了一个考察数字人文领域的深邃视角。

  

   在美国学术界,学术会议自始至终都是一个学术评价的过程。1999年和2002年,美国弗吉尼亚大学分别举办了“人文学计算是大学学科吗?”和“数字人文课程研讨班”两个重要的学术研讨会。会议由英文系教授杰罗米·麦根、约翰·安斯沃思和加州大学洛杉矶分校信息研究系教授约翰娜·德鲁克发起并组织,会前对申请参会的论文进行评审,论文质量合格的作者才有资格参会。会议中的报告、评议、问答等流程,既是对提交论文进行的学术评价,也是学术争鸣、学术批评的重要环节。来参加这两次研讨会的史蒂文·拉姆塞、马修·克申鲍姆、本特尼·诺维斯基等人,后来都成为数字人文研究领域最重要的代表人物。两次会议主题虽各有侧重,但又能看出其传承与发展的脉络,会议最终“正式将人文计算塑造为数字人文,并将目录校勘等有关文本等学术工作定义为它主要的内容”。2004年,约翰·安斯沃思与S. Schreibman、R. Siemence联合在布莱克威尔出版公司出版《相伴数字人文》(A Companion to Digital Humanities),该论文集收录37篇原创性成果,提供了一个全面而简洁的数字人文研究评述,书中明确提出要克服人文计算“单纯数字化”的倾向,从技术视角回归到研究对象相关知识体系的数字化呈现上来,建立“数字人文”新视角。2006年,许多原本属于人文计算领域的会议与研究中心纷纷更名搭上“数字人文”的快车。2007年,美国马里兰大学创建“数字人文中心网络”,依托关系网络和资源平台更加便利地与国际同行在项目共建、工具共用和知识共享等领域开展合作。目前已有两百多家一流高校的学术机构加入,成为重要的数字人文研究与协作的国际性科研组织。2009年,北美人文学科领域最重要的现代语言协会年会召开,会议上诸多讨论的主题都是围绕着数字人文展开,诸如何种研究可以算作数字人文研究,怎样的学者算作领域内的研究者,数字人文本身的目的到底是完成项目、探究理论化、研究计算技术、跨学科沟通、实践技术应用,还是单纯的科研经费需要,等等。学者们对数字人文本身存在很多不同理解、不同见解,交流、争论、批评成为常态,这既造就了开放的学术讨论和批评的空间,也彰显了数字人文独特的学术魅力。

  

   (三)学术期刊成为传播数字人文的重要平台

  

   人文计算的实践公认以1949年罗伯特·布萨神父为托马斯·阿奎那及相关作者的著作编制语词索引为开端。1966年由约瑟夫·雷宾主编的《计算机与人文学科》杂志创刊发行,标志著作为学科领域的人文计算正式走向学术舞台。1986年由ALLC在牛津大学出版社出版的《文学与语言计算》,被认为是数字人文领域最早的学术期刊。随着时代的发展,这本期刊也与时俱进,先改名《文学与语言计算:人文领域的数字学术》,后更名《人文领域的数字学术》,而被业界广泛熟知。2007年出版的《数字人文季刊》,直接抛弃传统的纸本模式,采取在线出版,涵盖人文学科数字媒体的各个方面。国际数字人文组织联盟,目前拥有《文学和语言计算》、《文本技术》、《人文领域计算机应用工作论文》、《数字人文季刊》四本同行评审期刊,通过召集圆桌会议、发表专题文章、组织书评和“回顾性”评论,向全球传播数字人文研究的理念、方法和成果。这些学术期刊,已经成为数字人文学术传播稳定的基本单元,成为数字人文学术共同体成员聚合、交流、监督的重要中心。“如果没有学术期刊作为组织的公共平台,那么,共同体就难以聚合,其边界也难以清晰,学术交流则难以高效地展开,共同体在研究和评价中的作用势必难以发挥。”

  

   学术共同体的形成取决于诸多条件,其中学术期刊对于学术共同体的产生、发展有着不可替代的作用。首先,学术期刊划定了学术共同体的边界。“学术共同体主要包括学术期刊系统和专业学会系统。这二者是学者进入学术共同体、参与并建立正式学术交流网络的关键平台,在学者和‘门外汉’之间划定了一条明显的边界,因此对学者的学术生涯和学术共同体的运行至关重要。”其次,学术期刊成为学术评价的平台。由于学术期刊的办刊主体是学术共同体成员,所以其除了展示、交流和传播作者的学术发现和见解之外,还有一个重要属性就是学术评价。学术共同体是构建学术传播秩序的当然主角,它可以自主地制定评价规则、评价标准和评价程序,并且主导评价过程。在对成果本身的评价中,学术共同体采用的是复合评价的制度,即学术会议的评议和讨论、发表前的评审(包括第三方评议)、论文发表或著作出版后的评价(学术期刊组织专家发表专题文章进行评议)、组织同行专家学术评奖。在这过程中,学术期刊不仅发挥了重要的引领作用,更体现出对学术标准、学术方法、学术品质、学术评价和学术精神等方面的公信力和权威性。再次,学术期刊成为凝聚学术共同体成员的中心。学术期刊作为学术传播的中心所在,其作用的发挥离不开学术共同体的认可和支持。所以说,“一个有生命力的学术期刊背后一定站着一个思想活跃的学术团体,而这个学术团体应该是一个世界性的学术共同体的有机组成部分”。以美国历史学会为例。在学术共同体的努力下,2006年以后的学会年会上,不定期出现数字史学的讨论版块,2014年始更设置了数字史学工作坊,提供各种层次的技能培训与资源分享。《美国历史杂志》从2013年开始辟专栏“数字史学评论”。近六年来,该专栏发表了评论文章101篇,先后点评超过100多个数字史学的研究和项目,突显了数字史学在美国史学界是一个充满活力和希望的话题。

  

三、数字人文助力人文学科“轮廓重绘”


   美国著名数字人文专家约翰·安斯沃思用七个“学术原语”概括数字人文常用的基本方法,即“发现”、“注释”、“比较”、“参考”、“抽样”、“说明”、“表现”。该理论后来被欧洲学者布兰克·托拜西和安德森·希拉等将其规范为五个基本原语,即“发现”、“收集”、“比较”、“传递”和“协作”。这种数字人文研究的“方法论共同体”,对于传统人文学科的价值在于,借助数字技术所拥有的多样性和扩张性,通过五个基本“学术原语”等手段进行跨界研究,从而扩展疆域和潜力,使学术领域实现“轮廓重绘”。对于数字技术的价值在于,“在注入人文主义价值观和方法后,其功能更加多元和强大,更符合人文学术的本质特征”。

  

   (一)从文献检索数据库到量化分析数据库的飞跃

  

   中国历史悠久,现存的古代文献资料浩如烟海。经过20多年的努力,历史文献的数字化已经取得了很大的进展,建成了一些可供检索的文献数据库。第一,图书馆、档案馆的古籍、档案数字化目录。第二,借助扫描、数码拍照等技术手段,将纸本转化为数码图像文件,形成了对古籍文献、档案资料、报纸期刊的图像文件进行存储和检索的图像数据库。第三,通过OCR技术与人工核对的结合,建成全文检索资料库。第四,事实型工具书被做成数据库、软件或插件。这些文献数据库,既有图书馆、档案馆、学术期刊自建的,也有商业公司生产的数据库产品。如北京大学的《中国历代典籍总目》、《中国基本古籍库》,首都师范大学电子文献国学传播中心的《古籍电子定本工程》,浙江大学与哥伦比亚大学合作开发的“甲骨文数字化项目”,国家图书馆的“华夏记忆项目”,敦煌研究院的“数字敦煌”,上海图书馆的“民国时期期刊全文数据库(1911~1949)”,南京图书馆的“中国近代文献图像数据库”,商务印书馆的“《东方杂志》期刊全文检索数据库”,瀚堂公司的“瀚堂近代报刊数据库”等为代表的古籍与专题数据库的大量出现,为学者们获得文献文本并储存提供了极大的便利。但这些文献数据库还处于比较原始的纸质替代状态,普遍只有检索功能,并且只能按原始资料的结构进行浏览,不能帮助研究者统计、分析文本。

  

   所谓量化数据库,“统指各种搜寻能够涵盖一定地域范围、具有一定时间跨度的整体性大规模个人或其他微观层面信息的系统(一手)资料,并将这些资料按照一定数据格式进行电子化,构建成适用于统计分析软件的量化数据库并进行定量研究的方法”。美国学术界利用历史资料进行量化数据库构建与研究的实践远远超前,其中学者们利用国际微观共享整合数据库、美国犹他人口数据库研究出的很多成果与著作,产生了重大的学术和社会影响,也成为中国学术界构建量化数据库的参照座标。从1980年代起,历时20多年时间,李中清、康文林团队建立了基于八旗户口册和清代皇室族谱资料的中国多代人口数据库系列(简称CMGPD),包含辽宁、双城和皇族三个子数据库。辽宁数据库涵盖了1749~1909年间辽东地区26万人的150余万条记录。双城数据库涵盖1866~1913年间双城县10万人的130余万条记录,并尝试与不同时段的家户地亩资料相连接。这些大规模、长时段的微观历史数据包含丰富的人口和社会经济信息,具有时间上的深度和空间上的广度,对人口统计学、家与家族、亲属关系、社会分层与流动、卫生健康等多个研究领域有重要价值。再比如美国哈佛大学教授包弼德领导的与北京大学中古史研究中心以及“中研院”史语所合作的“中国历代人物传记资料库”(简称CBDB),支持各种各样的查询。“包括单个人物查询、入仕途径、官职查询,还可以查询社会关系网络、查询两个人之间的社会关系,甚至查询不同地区间人物的关系。”所以,包弼德教授又把这种数据库称之为“关系数据库”。量化数据库的开发与研究对历史学而言,至少有两方面非常重要的价值:“一是丰富了历史学研究的方法论与范式;二是能有效利用大规模材料,实现不同材料的彼此连结,推动大规模、合作化研究形式的出现。”

  

   (二)从地图到地理信息系统和空间分析的飞跃

  

英国地理学家罗格·汤林森最早提出地理信息系统概念,并在1971年建立了加拿大地理信息系统。地理信息系统(Geographic Information System,简称GIS),以计算机技术为基础,通过对地理原始数据进行数据化的处理、存储、提取与管理,通过数据建模、空间分析、专题制图等手段,研究其与历史、社会、自然之间的关系,探索发展演变的规律和趋势。1990年代之后,西方发达国家相继建立了一些颇具特色的历史地理信息平台,如美国东海岸公共图书馆开发的弗吉尼亚1870~1935的铁路项目、纽约图书馆开发的纽约城市地理信息系统项目、加州大学伯克利分校(点击此处阅读下一页)


爱思想关键词小程序
本文责编:limei
发信站:爱思想(http://m.aisixiang.com)
本文链接:http://m.aisixiang.com/data/118616.html
文章来源:《澳门理工学报》(人文社会科学版)2019年第4期
收藏