什么是语料库语言学?

匿名2022-10-24 09:41:38
专稿回答

什么是语料库语言学.jpg


  语料库语言学(英文corpus linguistics)主要研究机器可读的自然语言文本的采集、存储、检索、统计、词性和句法标注、句法语义分析,以及具有上述功能的语料库在语言定量分析、词典编纂、作品风格分析、自然语言理解和机器翻译等领域中的应用;它是语言学的一个新的分支。


  在行为主义的影响下,亨利·库切拉(Henry Ku?0?0era)和纳尔逊·弗朗西斯(Nelson Francis)二位学者在1967年出版了《当代美语的计算分析》(Computational Analysis of Present-Day American English)一书,这是语料库语言学具有里程碑意义的事件。


  语料库语言学作为语言学的一个新的分支,当然离不开语料库。语料库在发展的初期,只进行词的一般分析,如词频统计等,后来增加了词的语法属性标注(如词性等);到现在,人们越来越开始重视对语料库作不同层次的标注,如语音、构词、句法、语义以及语用等层次的标注。


  语料库语言学在其发展的初期并没有引起太大的共鸣,但是现在这门学科已经得到越来越多人的承认,其应用也越来越广泛,从语言分析、语言教学、词典编撰、机器翻译到人工智能技术等领域都开始应用语料库。


  在我国,语料库语言学发展十分迅速。例如在学科发展方面,计算机专家黄昌宁教授出版了《语料库语言学》一书,这有助于人们了解这门学科的概貌。又如在语言教学领域,应用语言学专家桂诗春教授主持的国家“九五”社科规划项目“中国英语学习者语料库”收集了中国英语学习者的作文语料,这对于指导中国学生学习英语起到积极的作用。


  随着近年大数据、人工智能等技术的快速发展,语料库语言学将得以进一步发展,这门交叉学科的前景十分广阔。


  文/上官妍珍(作者单位:湖北大学文学院)


本文属原作者授权投稿专栏,须取得本网站的书面授权,未经授权严禁转载或用于其它商业用途
顶部
【稿件授权平台:学识网】