近日,第九届高等学校科学研究优秀成果奖(人文社会科学)揭晓。天博官网黄水清教授的著作《天博官网》获一等奖,同时,黄水清教授团队成员王东波教授的著作《天博官网》也获得了青年成果奖。
△ 点击图片阅读
《南农,一等奖+1!4项成果获奖!》
NEWS
高等学校科学研究优秀成果奖(人文社会科学),一般称之为教育部人文社科奖,是国内人文社科领域最高级别的政府奖,自1995年以来总共评选了9届,在人文社科领域举足轻重。黄水清教授的这个一等奖,也是江苏省在图书馆·情报与文献学领域获得的首个教育部人文社科一等奖。
产出这一重大成果的,是黄水清教授作为学科和团队带头人的我校信息资源管理学科和研究团队,该学科团队在校内与大农学科相比属于非主流,在校外与综合性大学、师范大学同行相比也属于非主流。迄今,我校仍然是全国除综合性大学、师范大学之外取得信息资源管理一级学科博士授权的唯一行业高校。
20多年的时间,在黄水清教授带领下,该学科从一个本科专业发展到现在的两个本科专业、一个专业学位硕士授权点、一个一级学科硕士学位授权点、一个一级学科博士学位授权点、一个博士后流动站,人员规模从十多个人增加到现在连师资博士后计算在内也才仅仅24人。该学科团队带头人和核心成员不但在重大奖项方面取得佳绩,还曾在同一个研究方向连续获得国家社科基金3个重大、1个重点项目。作为双重“非主流”的学科团队,殊为不易,也说明该学科团队从双重“非主流”中成功地走出了一条适合自己的发展之路。
该学科与团队如何从0到1组建壮大,如何从非农强势学科中脱颖而出,如何从“非主流”的氛围中走向一流、从小团队里走出大气象,耐人寻味、值得借鉴。
01. 搭好团队的“复杂网络”
“我们团队的结构是个‘复杂网络’,人数不多,但能形成有效聚合。”黄水清用了信息技术领域的专有名词做比团队的内部结构。
信息资源管理学科全部教师包括双肩挑干部和2名师资博士后在内目前仅24人,体量不大,却极具战斗力。由于人数有限,黄水清教授非常重视效率和发挥每名成员的长处,强调研究方向的集中与聚焦,即“有限资源、有限目标”。
大团队中的每个成员都是网络上的节点,方向靠近的成员再组成小方向团队,小方向的负责人类似于网络中的中心结节。当特定科研任务出现时,团队既可以以现有的小方向团队承接任务,也可以以某成员为核心迅速组建任务团队。
在负责人黄水清的统筹协调下,成员之间在研究特长上形成互补,相互支撑,紧密合作,都有承担任务的机会。学科团队中的核心团队、也是黄水清教授本人所在的小方向团队是文本信息处理团队,既在同行中独树一帜,创出南农品牌,也在技术方法、人才培养等方面支持整个团队的研究与发展。
据学校科学研究院的统计显示,2012年到2023年的11年间,该团队一共获得了27项国家社科基金项目,其中重大项目3项、重点项目3项。此外还有5项国家自科基金管理学部项目。这样的高产数据产生于如此体量的团队,极为稀缺。
科学研究院副院长朱战国介绍,团队成员、特别是刚入队的年轻教师,写论文可以,但在申报项目上如果没人点拨、团队间难以形成合力的话,成功的机率是很小的。
“从入职的第一天,团队的前辈们就叮嘱我头半年要把精力放在凝练研究方向上,他们手把手地带我一起申报项目,比我自己都更关心我的未来。”3年前进入团队的90后青年教师宋筱璇感慨,相比同期毕业入职其他高校的同学,自己非常幸运,走的每一步都有团队前辈提携。
入职半年不到的时间,她结合团队与博士论文的方向,以受众的“信息检索行为特征”为切入点,在黄水清教授的悉心指导下,顺利申请上了国家社科基金青年项目。
充分有效地团队聚合还体现在专业布局和人才培养上。据黄水清介绍,信息资源管理学科下有3个主体二级学科:图书馆学、情报学、档案学,但南农一直没有档案学,目的就是为了能够更好地聚焦图书馆学和情报学两个二级学科。在图书馆学和情报学两个二级学科中,南农又侧重于与信息技术相关的方向与领域,该方面无论是科研成果还是人才培养在全国同行中南农都是有口皆碑。比如,在本科生的专业课程中,“信息检索系统”这门偏向技术应用的课程从86级第一届本科生起历届都开设,每届都是黄水清给本科生讲授。
“我们必须带领学生回到源头,了解‘文本信息处理’的基本理念、机制和方法。”在黄水清看来,作为双重的“非主流”学科,要想在专业布局和人才培养上做出特色,出路就是顺应并抢在社会发展的潮流与方向之前,具体到南农的信息资源管理学科来说的就是聚焦技术。
“数字时代是由技术驱动的,要学会用技术来解决问题,”黄水清说团队的特色是“小而精”,精的一个表现就是熟练运用技术做实证,培养的人才亦是如此,他要求南农信息资源管理学科的本科生与研究生都能掌握信息加工、处理、检索的各种技术手段,本科生能够设计和开发检索工具,研究生熟悉最新模型与算法,如最新的AIGC。
02. 建好“语料”这一堪比“种质”的关键资源
技术、方法、手段是核心能力,而这一切的关键还在于将核心能力应用于恰当的对象,黄水清的选择是建设好“语料库”。
“语料对于我们的重要意义好比育种学家眼中的‘种子’,”在黄水清看来,语料是团队推进研究最为关键的基础设施工程。
所谓语料,就是真实语言环境中产生的语言材料,而语料库则由人工或机器标注好的真实语言材料组成的数据集。大规模、高质量的语料是投喂机器学习的重要“饲料”,也是信息资源管理学科与包括人工智能在内的各种信息技术嫁接、交叉、合作的途径。
“和我们农业育种学家的研究思路类似,一个高品质的、大数据的语料库是研究的基础,算法、模型则好比不同的育种栽培技术,在这样的‘种质’(语料库)+‘技术’(算法、模型)的基础上,我们就能针对不同的文本对象解决多元的具体应用场景的科学问题。”黄水清解释道。
“基于《天博官网》的典籍知识库构建及人文计算研究”“中国古代典籍跨语言知识库构建及应用研究”“先秦诸子典籍知识库建设及词典编纂”“雨花英烈文献知识组织及智能内容生成研究”,这些是黄水清本人所在的文本信息处理小方向团队近年获得国家社科基金资助的3个重大、1个重点项目,都与语料资源建设相关。但是,即便没有项目经费支持,只要选定了目标,黄水清也要求团队坚持做下去。
北京大学俞士汶先生研制的1998年1月人民日报日报语料在自然语言处理领域广受欢迎,自然语言处理的著名前辈专家冯志伟先生称其为“我国计算语言学发展史上著名的‘语言特征工程’”,但由于20多年未更新和补充新语料,冯先生认为目前“显得有些陈旧了”。
黄水清带领团队从2013年开始,对人民日报语料开展人工分词标注,目前已完成2015年以后的10个月的《天博体育官网天博TianBo》全文标注,体量超过3000万字,远超北大98年1月人民日报语料的100万字。冯志伟先生评价,这是“接过俞士汶先生点燃的火炬”,建设了“目前世界上规模最大的精加工现代汉语通用分词语料库”。由于受限项制约,人民日报分词语料库没有资格申请实际也未获得任务经费支持,但黄水清认为此项任务对多个学科的意义重大,没有经费也要做成,而且要向学界免费开放共享。目前,该语料库获得了学界的广泛好评,全球1000多个机构申请获得。
细观团队11年来的多项成果,语料对象从古籍文本到现代文本,类型从单语种到跨语言、多语种平行语料,的确是一场场“语料资源+技术方法”的精耕细作。
做语料库、建资源,或许大家都意识到重要,可为什么别的团队做不来,或者做着做着就放弃了?
“这是一场愚公移山式的长跑,没什么诀窍,就是坚持。”团队核心成员、南农大信息管理学院教授王东波告诉记者。以人民日报语料为例,王东波疫情期间曾被封在家乡,他将100多万字的语料进行了精细化人工标注,真的就是在浩如烟海的文本中做“绣花功夫”。半年的时间,他的视力下降了150度。
03. 洞悉前沿,提前部署,长期坚持
“一流团队的成长离不开一流的带头人,评判带头人的一项重要指标,就是看其在研究主题和方向的选择上是否有引领性的前瞻眼光。”朱战国表示,这个“眼光”起码要超前看5年。
古代汉语文本中的历代典籍是中华民族的文化根基,特别是先秦典籍,记载了中华文化的内在基因,是中华民族思想、文化、文学、历史的文献源头,也是中华民族性格铸就过程的文献实证。
据黄水清介绍,团队从2012年开始关注古代典籍文本,在人工标注的基础上,借助信息技术手段对典籍文本进行智能化处理。2013年12月30日,习近平总书记在主持政治局集体学习时指出,“要系统梳理传统文化资源,让收藏在禁宫里的文物、陈列在广阔大地上的遗产、书写在古籍里的文字都活起来”。黄水清敏锐地察觉了政策动向,认为团队的研究完全可以契合中央精神,并迅速将团队研究重心全面调整到以典籍文本为主要对象。2015年,团队以古代典籍文本的知识库构建及人文计算研究为选题,首次申报国家社科基金重大项目即获得立项。
2017年,党的十九大报告正式提出了“推动中华优秀传统文化创造性转化、创新性发展”的“两创”方针,并写入党章。这对于已提前布局面向古籍文本计算人文研究的黄水清团队而言,犹如注入了一股强心剂,大家凝成一鼓绳,虽然语料难、面向古籍的语料标注更难,但这个“硬骨头”啃下来,价值和意义不言而喻。
2018年,王东波来到比利时鲁文大学访学,当地英语、法语、德语、比利时语通行,但他发现,我们古代典籍鲜有对应的高质量外文文本,更缺乏句、词级别对应的多语种语料库。一年的访学结束了,王东波一回国就着手申请项目,他将方向锁定在了“中国古代典籍跨语言知识库构建及应用研究”上,2021年该项目顺利入选国家社科重大项目。
“习近平总书记在党的十九大报告中提到,‘推动中华优秀传统文化创造性转化、创新性发展,继承革命文化,发展社会主义先进文化’,中华优秀传统文化、革命文化和社会主义先进文化3个词出现在同一个句子中。”同为团队核心成员的南农大信息管理学院副院长何琳教授则将研究方向聚焦在了革命文化上。
雨花精神是南京革命文化的根与魂,协助南京雨花台烈士纪念馆做了几年数字化档案的她,将雨花英烈的生平、事迹进行细粒度的知识标注、知识组织,以智能技术生成的内容则可用于党史学习教育等场景。该项目也顺利入选了2023年的国家社科重点项目。
“洞悉前沿,提前部署,长期坚持”,这是黄水清指导团队的原则。在前瞻性地预判大的研究方向之后,团队奉行的是板凳一坐十年冷、稳扎稳打、一步一个脚印的长期主义。
这次获得教育部人文社科一等奖的成果根植于黄水清12年前拿到的国家社科基金重点项目,王东波、何琳在做的“以数字化手段赋能文化的传承传播”这一方向是从黄水清9年前的拿到的重大项目中生发出来的。
也是在12年前,黄水清带着学生们开始做《天博官网》的数字化和补遗工作,令他们吃惊的是,原文为9万7千字的《天博官网》经和三传编制成逐字、逐词索引后共有410万字。当年,燕京大学图书馆馆长洪业先生仅带着3个人以手工方式编完了这部400多万字的古籍索引。黄水清和学生们用技术手段经多轮校对后发现,洪业先生团队的差错率只有令人瞠目的万分之零点九,连万分之一都不到,堪称手工时代的奇迹!
正是典籍文本、革命文献中处处展现的先辈、先烈的崇高与伟大,引来团队成员心追手摹,成就了团队如今的凝聚力与“愚公移山”式的精神密码。
黄水清给团队成员或学生们指导项目时,经常问出一句话:“做这个的目的是什么?”他说,做我们这个学科要想把研究过程做得漂亮并不难,但我希望他们脑中想的、心中挂的,是这个项目的价值和意义。
“面向国家政策和社会需求做的研究才有意义,自然科学如此,人文社科同样如此。”黄水清说。
文字丨许天颖
图片丨受访团队提供
采访支持丨科研院人文社科办公室
编辑丨王璐
责任编辑丨王璐
校对丨赵广欣
审核丨许天颖
提振精神再出发!这次大会,传递了哪些重要信号?
院士下田记|稻田里,有本“养生秘籍”?
田间地头种“梨”想!南农大院士团队这样选育“宝藏好梨”
来自南农!她在巴黎,征战奥运!🥰
滨江校区抢鲜看③丨咱们的新校区,city不city?!
全球TOP5名校英才,共赴南农之约!
欢迎关注天博官网
点赞分享、点亮“在看”,给小秾一个鼓励吧!