本研究所以研发粤港澳大湾区多语制语言本体资源和社会应用资源为学术定位,组建由境内外专家构成的科研团队,运用先进的理论方法和技术手段,采集建立和扩展开发国家通用语言、汉语粤方言、英语和葡萄牙语的多语语料,建立多重权威官方语言本体结构资源和社会应用资源语料库;以《粤港澳大湾区发展规划纲要》精神为启动孵化期工作指导,为粤港澳大湾区规划发展建设涉及的语言资源基础建设、多重官方语言政策规划咨政,以及大湾区高校语言教学、语言翻译、语言能力测试与语言能力矫正等应用研究提供基础性的数据平台。

 

主要研究方向

      1. 语音数据库建设

      通过建立大湾区4种语言变体一定规模的母语人样本的语音数据库,系统提取研究各语言变体的声学数据。分析研究4种语言的声学表现与规律,确立语言变体的语音标准参数,计算语言变体与其标准语之间的距离数据,为语音标准及相关政策的制订提供客观标准和依据。

       2. 文本语料库建设

       构建大湾区政法、教育、媒体及经贸文本及港澳历史文献文本语料库。针对不同领域文本,开发文本分词和词性标注系统,建立多语标注语料库并开展基于语料库的文本校对、文本倾向性分析、舆情趋势预测等应用服务研究。

       3. 社会语言学调查

       调研“港澳”与“粤”区(以广州与深圳为代表)的行政、法律、教育、媒体、经贸、金融、企业及社会服务等主要官方语言使用领域中国家通用语言、粤方言、港澳英语、澳门葡语的构成状况与使用机制。

 

       联系人

       王一茹博士  menawong@bnu.edu.cn