欢迎访问四川大学文学与新闻学院(新闻学院、出版学院)!

行政管理

Administrative management

学院新闻

当前位置: 首页 > 行政管理 > 学院新闻 > 正文

《人民政协报》刊文专访我院王兆鹏教授

发布时间 :2022年06月08日 浏览量 :

2022年6月6日,《人民政协报》第5版发表了对我院文科讲席教授、博士生导师王兆鹏教授的专访《数字化助力学术研究发展——访四川大学文学与新闻学院文科讲席教授王兆鹏》。王兆鹏教授围绕在数字人文研究中的实践与感悟,介绍了我院中国文化全球传播数字融合实验室用数字技术向全球传播中华文化、为学术研究提供广阔平台,生动展示了数字技术对人文学术研究与中华优秀传统文化传播的推动作用。

 

《数字化数字化助力学术研究发展》刊发版面截图

专访原文

数字化助力学术研究发展

——访四川大学文学与新闻学院文科讲席教授王兆鹏

 

数据激活海量信息

学术家园:我们身处信息时代,数字化对人文学术研究的影响越来越大,面对浩瀚的文献资料,谈谈您的大数据使用经历和体会。

王兆鹏:我1992年开始用数据来研究古代文学。最初是用手工来搜集数据,后来慢慢地开发小程序,用计算机来自动处理数据。

我用的第一个小型数据库,是宋词的唱和数据库。我通读《全宋词》时,发现苏轼的《念奴娇·赤壁怀古》和贺铸《青玉案》(凌波不过横塘路)两首词,后人追和的很多。特别是《青玉案》,南宋人只要写此调,基本上是用贺铸词韵。为此,我写了一篇短文论述名篇与“和作”的关系。先是手工统计《全宋词》里《念奴娇》《青玉案》两首词的和韵之作,花了一两天的时间才弄完。后来想了解《全宋词》所有追和之作,看哪些词追和之作最多。而要把两万多首词的追和之作都弄清楚,人力很难完成。于是求助于友人,请他用计算机处理。我下载他写好的程序统计的结果后,不仅掌握了宋词里所有和作的数据,而且无意中发现了许多宋词的互见之作。原来有些同调同韵之词不是追和,而是同一首词分别收录于不同的作者名下。

当年我的老师唐圭璋先生写过《宋词互见考》的长篇论文,考察了宋词互见的情况,但毕竟是凭人工记忆,不无遗漏。此次尝到数据库的甜头后,以后凡是能用计算机处理的,就都用计算机来完成。

我从实践中深切体会到:只有想不到的数据,没有计算机做不了的数据。后来《全明词》和《全清词》出版后,我让学生将其中所收词人词作及其文献来源做成数据库,进行比对后,发现彼此都有漏收。不到10天,我就陆续写成《〈全明词〉漏收1000首补目》《〈全明词〉续补遗:日本稀见明人别集所载词辑录》《〈全清词·顺康卷〉前5册漏收词补目》等论文,为《全明词》和《全清词》增补了一两千首词。如果不用数据库,完全人工操作,10年也写不出这几篇论文。此后,我自己陆续开发了十几个数据库,为计量文学史和计量学术史研究提供了大量实用的数据。

学术家园:您从什么时候开始关注数字人文?如何理解数字人文?

王兆鹏:我从2012年开始关注数字人文。动因是基于内在的需求,要解决古典文学研究中的问题。我长期做宋代词人年谱,苦于各种资料分散,有些古地名弄不清楚在什么地方,经常要查历史地图,于是就想做词人地图,把词人一生所到所居之地都在数字地图上标识出来,为宋词教学和研究提供便利。做数字化地图,就需要数字技术来实现。在寻找技术支持过程中,开始了与数字人文的亲密接触。具体机缘是,2011年6月在首都师范大学参加《文学遗产》编委会扩大会期间,我把做词人地图的设想与几位学者交流,获得詹福瑞、左东岭、张国星等专家的大力鼓励支持,提升了我的信心。左东岭教授还向我推荐了首都师范大学做数字人文的计算机专家周文业先生,周先生又介绍我与北京一家做数字人文的公司合作,开发词人地图。这才开始了解什么是数字人文,知道数字人文能做什么。

数字人文,通俗地说,是用数字技术来研究人文科学。说得专业一点,是以数据为基础、平台为支撑、多学科交叉的学术团队为主体,运用计算机技术和方法来研究人文科学。数字人文的核心是数据,平台是各种数据的汇合,并具有检索、统计、分析、可视化呈现等功能。数字人文包含人文科学的内容和数字技术两个方面,一个人很难独立完成数字人文项目,需要人文学者和计算机技术人员组成团队,才能合作完成相关项目。如果把数字人文项目比作大餐,那么,数据是菜肴,平台是盛放菜肴的桌子,团队就是做各种菜肴、主食、点心的厨师队伍。

学术家园:具体在您的研究中是怎样进行的?请您举例谈谈。

王兆鹏:我主持的第一个数字人文项目,是国家社会科学基金重大招标项目《唐宋文学编年系地信息平台建设》,唐宋文学编年地图就是该项目的成果,2017年3月正式上线发布。《唐宋文学编年地图平台》核心内容包含两个方面的数据:唐宋时期作家的活动和创作编年系地数据、历史地图的矢量化数据。平台通过GIS(地理信息系统)将两方面的数据融合成地图平台,予以可视化呈现。这样,我们可以呈现唐宋作家的行踪轨迹:一位作家,一生经行寓居过哪些地方,何时在何地写有哪些作品、跟哪些人交往,一目了然;同时可以查阅一个地方,历史上有哪些作家、什么时候在此地活动过、写有哪些作品;还可以查阅任意一年,有哪些作家在哪些地方活动、写有哪些作品。原来只有单一的空间地理信息的平面地图,变成了有时间、地点、人物、活动和作品信息构成的立体多元信息系统。

我们团队由三个方面的专业人才构成,一是古代文学专业的教授和研究生,负责作家作品数据的挖掘采集和校订,二是历史地理专业的教授和研究生,负责将历史地图矢量化和查考历史地名的方位及所属行政区划;三是熟悉GIS的技术开发人员,负责将作家作品数据和历史地图数据进行融合,实现平台的设计功能。我们先自己设计数据模板,从作家年谱、年表和有编年的作家诗文集中提取作家活动和创作的编年系地数据,然后与矢量化的历史地图数据结合,再由技术人员开发成数字化的唐宋文学编年地图平台。数据模板不是一蹴而就,而是反复试验并与技术人员多次磨合后,才找到最优方案。

智能化、数据化、可视化

学术家园:当前数字人文研究发展情况如何?

王兆鹏:近日中共中央办公厅、国务院办公厅印发《关于推进实施国家文化数字化战略的意见》,部署推进实施国家文化数字化战略。虽然这个文件不是主要针对数字人文的,但数字人文与文化数字化关系十分密切。从某种意义上说,文化数字化,就是人文数字化、数字化人文。国家战略部署,对数字人文的发展将有重大推进作用。同时,当前数字人文的发展已上升到学科层面,中国人民大学信息管理学院已增设数字人文二级学科和博士点。这极有利于学术研究和人才培养。

从研究层面而言,创办了专门的学术期刊,涌现出多个数字人文平台。前年清华大学和中华书局合作创办了《数字人文》杂志。专业期刊的出现,标志着数字人文专业作者队伍的日益扩大和研究成果的日益增多。没有相对稳定的作者队伍和不断产出的学术成果,学术期刊是很难维持的。数字人文平台日益增多,如哈佛大学与北京大学等单位合作开发的《中国历史人物传记资料库》(CBDB)、复旦大学史地所和哈佛大学共建的《中国历史地理信息系统》(CHGIS)、中南民族大学和搜韵网合作开发的《唐宋文学编年地图平台》等。这些平台都免费开放,用户可以随时查询使用。

学术家园:数字人文技术为人文学术比如古典文学研究带来什么样的影响?是否产生了一些新的学术增长方向?

王兆鹏:数字人文技术为古典文学研究带来三大进展:获取资料的智能化、研究方法的数据化、研究结果的可视化。所谓智能化,是指从资料的关键词检索跨越到主题分类检索,从人工逐条识别下载升级到智能分类打包、一键提取。比如查地名,现有的数字化资源库,只能查到“点”的直接资料,如输入“福州”,查询结果里只包含有“福州”二字的资料。升级后的智能化数据库,则能查询到“面”的全部资料,即包含福州所辖全境的直接相关和间接相关资料,凡是数据库里跟福州有关系的人物、事件、物产、山川、建筑、作品等资料,也都能联类而及,一网打尽,而且这些资料是分地分时分类编排,有条不紊。由于每个地名都有古今对照,平台系统可以自动识别每个朝代同一地名所辖区域及其变化。查人物资料,不仅可以查询到包含人物姓名的资料,还能查询到与所查人物相关的生平资料、作品资料、评点资料、研究论著目录等。

数据化,是指今后的文学研究,将大量使用数据统计、定量分析。由于文学研究历来缺乏数据意识和数据积累,必须人工采集数据,数据的体量十分有限。而数字技术,可以把日益丰富的数字化资源库转化升级为关系型结构化数据库,为大数据时代文学研究提供充足的大数据。数字技术,可以解决文学数据提取的自动化、数据来源的全域化、数据规模的海量化三大难题。

研究成果的可视化,不仅是读屏读图时代的外在需求,也是文学研究创新的内在驱动,它可以让数据图形化、行踪地图化、场景仿真化。比如我们曾经统计唐代部分诗人的占籍情况,由武汉大学测绘学院高级工程师乔俊军先生绘制转换成图形,直观又美观,是学术、美术、技术的三合一,使学术研究成果也有了美感。

技术进步必然推动学术研究的进步。由于古典文学研究者对数字人文投入的还不够多,利用平台大数据来研究文学的突出成果还不显著,所以新的学术增长方向还不够明显。不过,我觉得,用大数据来量化分析文学史和学术史,将成为古典文学研究的新方向和新的增长点。

用数字技术盘活优秀文化资源

学术家园:古籍承载着中华优秀传统文化,数字化与人文社科学术研究的融合,对于中华优秀文化传播和发展有什么作用?

王兆鹏:数字技术与人文学术研究的融合,可以实现中华优秀文化的创造性转化与创新性发展,盘活优秀文化资源,使优秀的传统文化融入当下的文化建设,让“旧时王谢堂前燕,飞入寻常百姓家”。比如VR仿真技术,可以开发唐诗元宇宙、宋词元宇宙,以增加对唐宋诗词的沉浸感、代入感、参与感。将诗书画结合,开发NFT数字藏品,也是用之不尽的资源。

数字技术,可以让中国优秀传统文化更适应当下读屏读图时代的审美需求和消费需求,可以用更丰富多样的形式样态将中国优秀传统文化传播到全世界。

我们四川大学中国文化全球传播数字融合实验室,就致力于用数字技术向全球传播中华文化,第一步创建古今中外诗歌平台,将中国古典诗歌和五四以来的新诗、外国诗歌、包括外译的汉诗和中译的外国诗歌,汇合集成为一个全球诗歌平台,实现古今中外诗歌的深度融合;第二步是将中国古代书法绘画作品汇集于平台,实现中国诗书画的融合;第三步再将中外文学作品与影视戏曲作品融合。我们希望建成中华文化全球传播平台,成为中华文化全球传播的重要窗口。

王兆鹏教授简介

王兆鹏,四川大学文学与新闻学院文科讲席教授、博士生导师。曾任武汉大学珞珈杰出学者特聘教授、教育部高等学校中文学科教学指导委员会委员。现为中国词学研究会会长、中国李清照辛弃疾学会会长、中国宋代文学学会常务副会长、湖北省古代文学学会会长,《宋代文学研究年鉴》主编。主要研究唐宋文学和数字人文,主持国家社会科学基金重大项目2项。已出版《全唐五代词》《唐宋词史论》《词学史料学》等专著十余部,发表学术论文三百余篇。

 

 

来源|人民政协报

编辑|黄奕恬

责编|操慧