暨南大学留学生中介语语料库
简介:
暨南大学留学生中介语语料库是一个大型、多模态语料库,包含中国留学生在英语中介语口语和书面语中产生的语言数据。语料库收集于2010年至2020年,涵盖了各种学术和非学术语类。
数据来源:
口语语料:来自课堂讨论、访谈和焦点小组。
书面语料:来自论文、报告、邮件和社交媒体帖子。
内容:
语料库包含以下内容:
口语语料:约200万字,共2,000份录音文件。
书面语料:约500万字,共10,000份文本文件。
特点:
规模庞大:700万字以上的真实语言数据。
多模态:包含口语和书面语料。
真实性和自然性:数据是在自然情境中收集的,反映了留学生的真实语言使用。
全面性:涵盖了多种语类和话题。
可搜索性:通过先进的搜索工具,可以轻松检索特定语言形式和结构。
应用:
暨南大学留学生中介语语料库可用于广泛的研究,包括:
第二语言习得研究
语言教学法研究
语料库语言学研究
语言评估和测试
自然语言处理
获取方式:
语料库可通过暨南大学语言工程研究中心申请获取。有关详细信息,请访问:
[]