2022年伊始,亚星游戏官网868副教授、语言认知及语言应用研究基地专职研究员肖巍博士指导在读硕士于国际期刊发表系列论文,揭示了学术论文中的信息分布规律。论文To move or not to move: An entropy-based approach to the informativeness of research article abstracts across disciplines于2022年2月10日发表于国际著名计量语言学期刊Journal of Quantitative Linguistics(SSCI和AHCI双检索)。该文将信息科学的理论和方法引入学术英语研究,结合Shannon信息论和Swales体裁分析IMRD模型,测量了318篇自然科学、社会科学和人文学科论文摘要各语步的一、二、三元组香农熵和Miller-Madow熵,探讨了学术论文摘要的信息分布模式及其学科差异。研究发现:学术论文摘要中的信息量呈不均衡分布,结果和引言语步的信息量高于方法和讨论语步;二、三元组的信息量较为接近,但均高于一元组信息量;不同学科的信息分布模式既有相似,又有差异,即:自然科学论文摘要各语步的信息量呈平稳-上升-下降模式,人文学科论文摘要除方法语步信息量极低外,其余语步信息量分布模式与自然科学相似,而社会科学论文摘要的信息量随着语步推进持续下降。本文对于学术论文摘要写作的教学与实践,以及计量语言学研究方法应用范围的拓宽,均有启示和借鉴意义。肖巍博士为论文第一兼通讯作者,合作者为其指导的硕士生李丽、刘尽。Doi:10.1080/09296174.2022.2037275。

论文How is information content distributed in RA introductions across disciplines? An entropy-based approach发表于西班牙语料库语言学会会刊Research in Corpus Linguistics2022年第1期。该文同样从信息科学的视角研究学术英语,结合Shannon信息论和Swales体裁分析CARS模型,测量了120篇自然科学、社会科学和人文学科论文摘要各语步的一、二、三元组香农熵,探讨了学术论文引言的信息分布模式及其学科差异。研究发现:学术论文引言中的信息量呈不均衡分布,各语步信息量从高到低依次为语步一“确立研究领域”、语步三“填补研究空间”和语步二“建立研究空间”;不同信息量测量指标可能反映了学术论文引言不同的语言特征;学术论文引言信息分布模式存在学科间的异同:自然科学论文引言的语步一信息量更高,社会科学论文引言的语步三信息量更高,而无论何种学科的语步二信息量均为最低。本文对于基于体裁的学术写作教学,以及计量语言学研究方法应用范围的拓宽,均有启示和借鉴意义。肖巍博士为论文第一兼通讯作者,合作者为其指导的硕士生刘尽、李丽。Doi:10.32714/ricl.10.01.04
该系列论文曾于第十二届国际语料库语言学大会(CILC 2021)和第七届全国外语教学与研究中青年学者论坛宣读,并得到教育部人文社会科学研究青年基金项目、重庆市社会科学规划青年项目、重庆市交叉学科研究生导师团队建设项目“语言、认知与智能计算”等项目资助。依托该系列研究,团队研究生取得了重庆市研究生科研创新项目、重庆市研究生创新能力提升先进个人、研究生国家奖学金等成绩和荣誉。该系列论文的发表是学院和基地在“大数据”背景下运用数据挖掘手段进行语言研究的重要突破,也是“新文科”背景下外语人才培养和研究生科研创新的可喜成果。
文字/肖巍
审核/肖巍