2018年1月5日上午,亚星游戏官网868跨学科团队在教师发展中心召开新年首次讨论会,这次讨论会的主题为语料库的标注规范。黄萍教授、蒋婷教授、李良炎副教授、汪兴富副教授以及黄河老师、及其他跨学科团队成员和部分研究生参加了本次讨论会。
黄河老师主讲了大规模深度标注的语料库类型,大规模高质量人工标注的类型及系统模型,标注规范及标注方法,让大家从专业的角度理解了标注规范对于语料库建设的重要性。蒋婷老师结合自己的国家社科项目中的仲裁语料语步切分,转写规范,标注语料等实例让大家对于标注规范有了更深刻的理解。

之后,李良炎老师从研究与工程的区别,资源条件,技术路线,标注界面及可视化等方面与大家进行了讨论。汪兴富老师也结合COCA语料库对于语料收集及平台建设给出了相应的建议。
最后,大家讨论并确定了从语篇切分入手,进行小系统试验的平台搭建的技术路线。此次讨论会对于语料库平台搭建及后续的语料标注具有重要意义。
编辑/隋海兵
图片/蒋婷 康建伟 刘冰