一、课程名称(中英文)
中文名称:人工智能与自然语言处理
英文名称:Artificial Intelligence and Natural Language Processing
二、教学内容
主要包含七个重要部分:自然语言处理综述、语言模型(N-gram语言模型)、序列标注问题(Sequence labelling problem)、句法分析、语义分析、情感分析、词向量等。其中:自然语言处理综述主要介绍人工智能发展历史综述,不同领域自然语言处理应用问题及方法等,自然语言处理基本技术方法概述,其中包括部分机器学习知识,自然语言处理层次架构,具体任务介绍,歧义问题,经验主义方法等;语言模型主要包括自然语言处理相关语言模型基础理论以及相关平滑处理技术等(如N-Gram;链式规则Chain Rule等);序列标注问题(Sequence labelling problem)主要知识点包括序列标注学习极其相关应用等(如离散/连续马尔科夫模型、中文分词、词性标注、命名实体识别等);句法分析主要包括自然语言中语法分析等基础理论知识等(如上下文无关文法、自上而下句法分析、概率上下文无关文法、最大似然训练、依存语法树等);语义分析主要主要知识点包括自然语言中语义分析等基础理论知识等(如语义角色、语义角色标注、基于句法树方法等);情感分析(Sentiment Analysis)主要包括情感分析技术理论与方法等(如感情倾向性分析等);词向量主要包括基于神经网络的自然语言处理技术与基础理论知识等(如Word2vec词向量、基于循环神经网络语言模型等)。力求跟踪自然语言处理的发展脉络、技术理论、产业成果并以翔实的形态进行展现教学。
三、课程特色
除了讲授自然语言处理领域必要的核心概念、任务和方法,兼顾经典理论和前沿研究方向,重视理解和掌握基本原理和方法,从数理基础、方法与应用、前沿专题三个层次培养学生的科学思维方法。鼓励学生针对某一方向深入思考,引导学生应用所学知识建模解决相关问题,在实践分析中深化相关问题的理解。牢固树立问题建模与求解的观点,同时够熟练使用统计概率、信息学、数据挖掘、机器学习、信息检索、自然语言处理等理论方法,求解自然语言中实际应用问题,如序列标注学习问题(分词/词性标注/命名实体识别/依存语法树等),文本摘要问题,机器翻译系统等,使学生真正做到理论与实际相结合,能够将所学的相关理论知识与真实应用下的场景落地相结合,通过实践项目引导学生进一步深入探究,鼓励积极思考与创新,培养学生实际分析问题、解决问题的能力。